-
公开(公告)号:CN103812872B
公开(公告)日:2016-11-23
申请号:CN201410073426.X
申请日:2014-02-28
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于混合狄利克雷过程的网络水军行为检测方法及系统,其方法为,采集包括用户行为特征和内容特征的原始数据,并对每个维度的原始数据进行量化表示构成用户的历史行为向量,构成待聚类用户数据集;对待聚类用户数据集中的历史行为向量进行聚类,得到至少一个分类用户行为集合;将所有分类用户行为集合中的数据进行转换,对转换后的数据中具有相同用户标识的数据合并,得到序列数据库;模式挖掘模块对序列数据库进行序列模式挖掘,得到分别对应每个分类用户行为集合的至少一个事务序列模式;水军判断模块比较每个事务序列模式,就可以判断出哪个分类用户行为集合是水军账号。本发明很容易分辨出哪一类属于水军账号。
-
公开(公告)号:CN103795592A
公开(公告)日:2014-05-14
申请号:CN201410027720.7
申请日:2014-01-21
Applicant: 中国科学院信息工程研究所
IPC: H04L12/26
Abstract: 本发明涉及一种网络水军的检测方法及装置。其中,网络水军的检测方法包括:步骤一,将原始的用户描述信息表示为归一化的用户描述向量,从用户描述向量中筛选出已分类数据,将该已分类数据的a%作为深度信念网络DBN模型的训练数据,将该已分类数据的b%作为DBN模型的检测数据;步骤二,用训练数据训练DBN模型,输出训练得到的DBN模型;步骤三,检验输出DBN模型的收敛性和判定准确率,根据检验结果调整所述步骤一和步骤二中的相关参数,直至所述输出DBN模型达到预设收敛条件或终止条件;步骤四,使用最终DBN模型对网络水军进行检测。本发明的网络水军的检测方法及装置,既提高了网络水军检测算法的收敛性和准确率,又缩短了海量样本数据下的模型训练时间。
-
公开(公告)号:CN104836700A
公开(公告)日:2015-08-12
申请号:CN201510184723.6
申请日:2015-04-17
Applicant: 中国科学院信息工程研究所
IPC: H04L12/26
Abstract: 本发明涉及一种基于IPID和概率统计模型的NAT主机个数检测方法。该方法把一段整体时间内的数据包,平均分割成n个时间段的数据包进行处理,在每个时间段里采用IPID的方法来得到IPID序列集,然后再对每两个相邻的时间段的IPID序列集计算交叉序列的个数,最终再通过整体来计算NAT后主机的总的个数。本发明能够解决IPID检测法中存在的序列混淆、序列间断问题,提高NAT主机个数计算的准确率。
-
公开(公告)号:CN103955714A
公开(公告)日:2014-07-30
申请号:CN201410146467.7
申请日:2014-04-09
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及水军检测模型构建方法,包括步骤:对一组样本数据进行任务分割得到多个任务,平均特征抽取得到多个任务的训练样本集;多任务特征选择,得到多个任务的特征权重矩阵;设定一个阈值δ,判断特征权重矩阵中的一个列向量中的最大值是否大于阈值δ,如是,下一步;否则,放弃所述列向量,执行步骤5;将所述列向量添加到共享特征项集合中;判断特征权重矩阵中是否存在未与阈值δ进行比较的列向量,如是,执行步骤3;否则,下一步;输入新的训练数据集;计算得到线性分类值;设置水军阈值,使线性分类值大于水军阈值时判定其为水军。本发明利用多任务学习的方法建立水军检测模型,实现了方便快捷的识别出水军用户。
-
公开(公告)号:CN103812872A
公开(公告)日:2014-05-21
申请号:CN201410073426.X
申请日:2014-02-28
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于混合狄利克雷过程的网络水军行为检测方法及系统,其方法为,采集包括用户行为特征和内容特征的原始数据,并对每个维度的原始数据进行量化表示构成用户的历史行为向量,构成待聚类用户数据集;对待聚类用户数据集中的历史行为向量进行聚类,得到至少一个分类用户行为集合;将所有分类用户行为集合中的数据进行转换,对转换后的数据中具有相同用户标识的数据合并,得到序列数据库;模式挖掘模块对序列数据库进行序列模式挖掘,得到分别对应每个分类用户行为集合的至少一个事务序列模式;水军判断模块比较每个事务序列模式,就可以判断出哪个分类用户行为集合是水军账号。本发明很容易分辨出哪一类属于水军账号。
-
公开(公告)号:CN103729678A
公开(公告)日:2014-04-16
申请号:CN201310681479.5
申请日:2013-12-12
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于改进DBN模型的水军检测方法,具体包括以下步骤:步骤1:采用已分类数据集对原始DBN深度信念网络模型进行训练和检测,构成改进DBN深度信念网络模型;步骤2:将待分类数据集中的数据输入改进DBN深度信念网络模型进行分类,完成对水军用户的识别。本发明结合DBN深度信念网络和PSO粒子群算法对“苍蝇水军”进行识别,然后构造DBN模型,用已分类数据集对模型进行训练,最后用得到的模型对待分类用户数据进行分类,即实现了“苍蝇水军”的识别。该方法是对BP神经网络算法的改进,既可以保证较高的判定准确率,又具有较短的训练时间,且不易陷入局部最优解。
-
公开(公告)号:CN104836700B
公开(公告)日:2018-11-06
申请号:CN201510184723.6
申请日:2015-04-17
Applicant: 中国科学院信息工程研究所
IPC: H04L12/26
Abstract: 本发明涉及一种基于IPID和概率统计模型的NAT主机个数检测方法。该方法把一段整体时间内的数据包,平均分割成n个时间段的数据包进行处理,在每个时间段里采用IPID的方法来得到IPID序列集,然后再对每两个相邻的时间段的IPID序列集计算交叉序列的个数,最终再通过整体来计算NAT后主机的总的个数。本发明能够解决IPID检测法中存在的序列混淆、序列间断问题,提高NAT主机个数计算的准确率。
-
公开(公告)号:CN104951499B
公开(公告)日:2018-03-02
申请号:CN201510199720.X
申请日:2015-04-23
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种跨域用户关联方法及信息推送方法。本方法为:1)从网络中收集HTTP包,并按照设定的时间窗口对采集的包划分;2)对每一窗口内的包,根据FixCookie列表进行聚类,将同一用户的一次请求聚在一起,然后将各窗口内相同用户的用户组集合合并为一个用户组集合;3)对采集的包进行聚类,将主机名、cookie名和值相同的包聚为一组,将同一组内的包对应的用户组集合合并;4)对采集的包进行聚类,将主机名、cookie名和值相同且不存在fixCookie冲突的包聚为一组,将同一组内的包对应的用户组集合合并;5)将位于4)中同一用户组集合内的用户判定为不同域中的同一用户。本方法准确率高,聚类效果好。
-
公开(公告)号:CN103795592B
公开(公告)日:2017-01-25
申请号:CN201410027720.7
申请日:2014-01-21
Applicant: 中国科学院信息工程研究所
IPC: H04L12/26
Abstract: 本发明涉及一种网络水军的检测方法及装置。其中,网络水军的检测方法包括:步骤一,将原始的用户描述信息表示为归一化的用户描述向量,从用户描述向量中筛选出已分类数据,将该已分类数据的a%作为深度信念网络DBN模型的训练数据,将该已分类数据的b%作为DBN模型的检测数据;步骤二,用训练数据训练DBN模型,输出训练得到的DBN模型;步骤三,检验输出DBN模型的收敛性和判定准确率,根据检验结果调整所述步骤一和步骤二中的相关参数,直至所述输出DBN模型达到预设收敛条件或终止条件;步骤四,使用最终DBN模型对网络水军进行检测。本发明的网络水军的检测方法及装置,既提高了网络水军检测算法的收敛性和准确率,又缩短了海量样本数据下的模型训练时间。
-
公开(公告)号:CN104951499A
公开(公告)日:2015-09-30
申请号:CN201510199720.X
申请日:2015-04-23
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F16/951 , H04L67/02 , H04L67/26
Abstract: 本发明公开了一种跨域用户关联方法及信息推送方法。本方法为:1)从网络中收集HTTP包,并按照设定的时间窗口对采集的包划分;2)对每一窗口内的包,根据FixCookie列表进行聚类,将同一用户的一次请求聚在一起,然后将各窗口内相同用户的用户组集合合并为一个用户组集合;3)对采集的包进行聚类,将主机名、cookie名和值相同的包聚为一组,将同一组内的包对应的用户组集合合并;4)对采集的包进行聚类,将主机名、cookie名和值相同且不存在fixCookie冲突的包聚为一组,将同一组内的包对应的用户组集合合并;5)将位于4)中同一用户组集合内的用户判定为不同域中的同一用户。本方法准确率高,聚类效果好。
-
-
-
-
-
-
-
-
-