一种基于最近邻及相似度测量检测钓鱼网页的方法

    公开(公告)号:CN102170447A

    公开(公告)日:2011-08-31

    申请号:CN201110112442.1

    申请日:2011-04-29

    Abstract: 一种基于最近邻及相似度测量检测钓鱼网页的方法是以网页整体图像的图片为出发点,提取其尺度不变转化特征:在钓鱼网页检测阶段进行相似特征的快速查询,查询所得相似特征交给机器学习匹配模块进行识别;机器学习匹配模块在系统训练阶段接收特征提取模块传来的特征数据进行训练,优化网页相似性阈值的参数;在钓鱼网页检测阶段,接收特征提取模块传来的特征数据,计算网页之间的相似度,最后根据网页相似性阈值判断钓鱼网页;另外,还加入了一种分类方法——贝叶斯可添加回归树,对可疑网页进行预测;在钓鱼网页检测过程中通过提取特征,以此作为钓鱼网页检测的依据,在保证高准确率的同时,显著减小网页检测时间。

    基于匈牙利匹配算法的钓鱼网页检测方法

    公开(公告)号:CN101826105A

    公开(公告)日:2010-09-08

    申请号:CN201010139929.4

    申请日:2010-04-02

    Abstract: 基于匈牙利匹配的钓鱼网页检测方法首先提取渲染后网页的文本特征签名、图像特征签名以及网页整体特征签名,比较全面地刻画了网页访问后的特征;然后通过匈牙利算法计算二分图的最佳匹配来寻找不同网页签名之间匹配的特征对,在此基础上能够更加客观地度量网页之间的相似性,从而提高钓鱼网页的检测效果。在方法中还利用曲线下面积值来确定文本特征、图像特征以及全局图像特征的内部权重;利用对数回归分析法确定了网页相似性计算中的文本相似性、图像相似性和全局图像相似性之间的相对权重。本发明提出的基于匈牙利匹配的钓鱼网页检测方法,在精度、召回率上都有了很大提高。

    基于匈牙利匹配算法的钓鱼网页检测方法

    公开(公告)号:CN101826105B

    公开(公告)日:2013-06-05

    申请号:CN201010139929.4

    申请日:2010-04-02

    Abstract: 基于匈牙利匹配的钓鱼网页检测方法首先提取渲染后网页的文本特征签名、图像特征签名以及网页整体特征签名,比较全面地刻画了网页访问后的特征;然后通过匈牙利算法计算二分图的最佳匹配来寻找不同网页签名之间匹配的特征对,在此基础上能够更加客观地度量网页之间的相似性,从而提高钓鱼网页的检测效果。在方法中还利用曲线下面积值来确定文本特征、图像特征以及全局图像特征的内部权重;利用对数回归分析法确定了网页相似性计算中的文本相似性、图像相似性和全局图像相似性之间的相对权重。本发明提出的基于匈牙利匹配的钓鱼网页检测方法,在精度、召回率上都有了很大提高。

Patent Agency Ranking