-
公开(公告)号:CN102098235A
公开(公告)日:2011-06-15
申请号:CN201110020896.6
申请日:2011-01-18
Applicant: 南京邮电大学
Abstract: 基于文本特征分析的钓鱼邮件检测方法,去除掉邮件中的非文本内容;利用了邮件解析器对邮件进行解析;利用了正则表达式算法提取了邮件中的网站链接;再次利用正则表达式算法提取了链接中的相关特征;利用域名注册检索引擎,得到了网站注册时间特征。运用这些所提取的文本特征,组成邮件的特征向量。通过实验,证明能够提高钓鱼邮件的精度和召回率,并节省程序运行的时间和开销。本发明从以往的这些文本特征中进行了筛选,将效果比较好的几个特征挑选出来,并结合钓鱼邮件的特点和现有的研究基础提出几种新的针对钓鱼邮件检测的文本特征。使用本发明对可疑邮件进行检测。
-
公开(公告)号:CN101826105B
公开(公告)日:2013-06-05
申请号:CN201010139929.4
申请日:2010-04-02
Applicant: 南京邮电大学
IPC: G06F17/30
Abstract: 基于匈牙利匹配的钓鱼网页检测方法首先提取渲染后网页的文本特征签名、图像特征签名以及网页整体特征签名,比较全面地刻画了网页访问后的特征;然后通过匈牙利算法计算二分图的最佳匹配来寻找不同网页签名之间匹配的特征对,在此基础上能够更加客观地度量网页之间的相似性,从而提高钓鱼网页的检测效果。在方法中还利用曲线下面积值来确定文本特征、图像特征以及全局图像特征的内部权重;利用对数回归分析法确定了网页相似性计算中的文本相似性、图像相似性和全局图像相似性之间的相对权重。本发明提出的基于匈牙利匹配的钓鱼网页检测方法,在精度、召回率上都有了很大提高。
-
公开(公告)号:CN102098235B
公开(公告)日:2013-08-07
申请号:CN201110020896.6
申请日:2011-01-18
Applicant: 南京邮电大学
Abstract: 基于文本特征分析的钓鱼邮件检测方法,去除掉邮件中的非文本内容;利用了邮件解析器对邮件进行解析;利用了正则表达式算法提取了邮件中的网站链接;再次利用正则表达式算法提取了链接中的相关特征;利用域名注册检索引擎,得到了网站注册时间特征。运用这些所提取的文本特征,组成邮件的特征向量。通过实验,证明能够提高钓鱼邮件的精度和召回率,并节省程序运行的时间和开销。本发明从以往的这些文本特征中进行了筛选,将效果比较好的几个特征挑选出来,并结合钓鱼邮件的特点和现有的研究基础提出几种新的针对钓鱼邮件检测的文本特征。使用本发明对可疑邮件进行检测。
-
公开(公告)号:CN101826105A
公开(公告)日:2010-09-08
申请号:CN201010139929.4
申请日:2010-04-02
Applicant: 南京邮电大学
IPC: G06F17/30
Abstract: 基于匈牙利匹配的钓鱼网页检测方法首先提取渲染后网页的文本特征签名、图像特征签名以及网页整体特征签名,比较全面地刻画了网页访问后的特征;然后通过匈牙利算法计算二分图的最佳匹配来寻找不同网页签名之间匹配的特征对,在此基础上能够更加客观地度量网页之间的相似性,从而提高钓鱼网页的检测效果。在方法中还利用曲线下面积值来确定文本特征、图像特征以及全局图像特征的内部权重;利用对数回归分析法确定了网页相似性计算中的文本相似性、图像相似性和全局图像相似性之间的相对权重。本发明提出的基于匈牙利匹配的钓鱼网页检测方法,在精度、召回率上都有了很大提高。
-
-
-