-
公开(公告)号:CN103973666A
公开(公告)日:2014-08-06
申请号:CN201310351135.8
申请日:2013-08-13
Applicant: 哈尔滨理工大学
Abstract: 本发明提供了一种垃圾邮件僵尸主机检测方法及装置,涉及计算机网络安全领域。该方法包含训练阶段和检测阶段:S1、通过序贯概率比的方法估计正常主机和垃圾邮件僵尸主机的高斯模型参数,分别建立高斯模型,并计算高斯模型的门限值;S2、通过垃圾邮件分类器对待检测主机发出的邮件进行检测,得到检测分数;S3、将所述检测分数进行归一化处理,将检测分数调整在[0,1]区间内;S4、基于调整后的检测分数,通过步骤S1中建立的高斯模型计算垃圾邮件僵尸主机的统计量,并将统计量与所述门限值做比较,判决待检测主机是否为垃圾邮件僵尸主机。本发明通过检测发送垃圾邮件的僵尸主机,能够切断垃圾邮件发送的源头,从根本上减少垃圾邮件的发送。
-
公开(公告)号:CN104050242B
公开(公告)日:2018-03-27
申请号:CN201410228055.8
申请日:2014-05-27
Applicant: 哈尔滨理工大学
Abstract: 本发明涉及一种基于最大信息系数的特征选择、分类方法及其装置,所述特征选择方法包括:S1,基于互信息准则将原始特征进行排序,将相关度低于阈值的特征删除,并将所述相关度高于阈值的特征形成初始特征子集;S2,计算在所述初始特征子集中的特征之间的最大信息系数;S3,根据所述最大信息系数,删除所述初始特征子集中的冗余特征,得到低维特征子集。本发明所述的特征选择方法通过使用互信息以及最大信息系数的方式进行特征选择,从而去除冗余特征,降低了数据的维度。
-
公开(公告)号:CN104050556B
公开(公告)日:2017-06-16
申请号:CN201410228073.6
申请日:2014-05-27
Applicant: 哈尔滨理工大学
Abstract: 本发明涉及一种垃圾邮件的特征选择方法及其检测方法,包括:基于字节的N‑grams方法进行邮件的特征提取;根据提取的特征与预设邮件类别的相关度进行特征排序生成初始特征子集;根据近似马尔科夫毯算法删除所述初始特征子集中的冗余特征得到候选特征子集;通过在线逻辑回归分类器对所述候选特征子集进行预测并根据预测结果对所述候选特征子集进行评价选择最优特征子集;根据所述最优特征子集利用在线逻辑回归分类器对垃圾邮件进行检测。采用本发明提出的垃圾邮件的特征选择方法及其检测方法,使得垃圾邮件的特征选择及垃圾邮件检测的计算过程简单,时间复杂度低,而且使得垃圾邮件检测的准确率大大提高。
-
公开(公告)号:CN104050556A
公开(公告)日:2014-09-17
申请号:CN201410228073.6
申请日:2014-05-27
Applicant: 哈尔滨理工大学
IPC: G06Q10/10
Abstract: 本发明涉及一种垃圾邮件的特征选择方法及其检测方法,包括:基于字节的N-grams方法进行邮件的特征提取;根据提取的特征与预设邮件类别的相关度进行特征排序生成初始特征子集;根据近似马尔科夫毯算法删除所述初始特征子集中的冗余特征得到候选特征子集;通过在线逻辑回归分类器对所述候选特征子集进行预测并根据预测结果对所述候选特征子集进行评价选择最优特征子集;根据所述最优特征子集利用在线逻辑回归分类器对垃圾邮件进行检测。采用本发明提出的垃圾邮件的特征选择方法及其检测方法,使得垃圾邮件的特征选择及垃圾邮件检测的计算过程简单,时间复杂度低,而且使得垃圾邮件检测的准确率大大提高。
-
公开(公告)号:CN103973666B
公开(公告)日:2017-07-14
申请号:CN201310351135.8
申请日:2013-08-13
Applicant: 哈尔滨理工大学
Abstract: 本发明提供了一种垃圾邮件僵尸主机检测方法及装置,涉及计算机网络安全领域。该方法包含训练阶段和检测阶段:S1、通过序贯概率比的方法估计正常主机和垃圾邮件僵尸主机的高斯模型参数,分别建立高斯模型,并计算高斯模型的门限值;S2、通过垃圾邮件分类器对待检测主机发出的邮件进行检测,得到检测分数;S3、将所述检测分数进行归一化处理,将检测分数调整在[0,1]区间内;S4、基于调整后的检测分数,通过步骤S1中建立的高斯模型计算垃圾邮件僵尸主机的统计量,并将统计量与所述门限值做比较,判决待检测主机是否为垃圾邮件僵尸主机。本发明通过检测发送垃圾邮件的僵尸主机,能够切断垃圾邮件发送的源头,从根本上减少垃圾邮件的发送。
-
公开(公告)号:CN104050242A
公开(公告)日:2014-09-17
申请号:CN201410228055.8
申请日:2014-05-27
Applicant: 哈尔滨理工大学
CPC classification number: G06F17/30598 , G06F17/30705
Abstract: 本发明涉及一种基于最大信息系数的特征选择、分类方法及其装置,所述特征选择方法包括:S1,基于互信息准则将原始特征进行排序,将相关度低于阈值的特征删除,并将所述相关度高于阈值的特征形成初始特征子集;S2,计算在所述初始特征子集中的特征之间的最大信息系数;S3,根据所述最大信息系数,删除所述初始特征子集中的冗余特征,得到低维特征子集。本发明所述的特征选择方法通过使用互信息以及最大信息系数的方式进行特征选择,从而去除冗余特征,降低了数据的维度。
-
-
-
-
-