-
公开(公告)号:CN103064971A
公开(公告)日:2013-04-24
申请号:CN201310002969.8
申请日:2013-01-05
Applicant: 南京邮电大学
Abstract: 为了更好的发现垃圾评论,本发明提出一种基于评分和中文情感分析的垃圾评论检测系统,主要是针对大部分的电子商务网站提供给用户对于所购买的商品发表自己的评论,利用评分机制结合中文情感分析,来检测哪些评论是垃圾评论,进而为用户购买商品提供参考意见。本系统提出一种新的情感模式的抽取方法,改善了分类器的性能,提高了分类精度,并将中文情感分析用于垃圾评论检测中,从一个新的角度来发现垃圾评论,帮助用户做出购买决策。
-
公开(公告)号:CN103020482A
公开(公告)日:2013-04-03
申请号:CN201310002583.7
申请日:2013-01-05
Applicant: 南京邮电大学
Abstract: 利用基于关系的垃圾评论检测方法,是一种基于网购的评论者,评论以及店家的关系特征的检测方法。提出了评论者的可信度,评论的诚实度以及店家的可靠度的概念,并引出了三者相互关系:评论者所写的评论的诚实度越高,他的可信度就越高;店家拥有的来自可信的评论者的诚实评论越多,他的可靠度就越高;评论被其他诚实评论支持的个数越多,他的诚实度就越高。第一次提出这样的迭代关系,并将其应用到实际的检测工作中。利用关系特征建模,并将这个模型和三者的其他特征所得到的模型相结合,得到改进后的用于垃圾评论检测的模型。
-
公开(公告)号:CN102096781B
公开(公告)日:2012-11-28
申请号:CN201110020890.9
申请日:2011-01-18
Applicant: 南京邮电大学
Abstract: 一种基于网页关联性的钓鱼检测方法整合了页面之间关联性以及页面的整体性布局特征,主要解决了基于网页关联性和视觉相似性角度进行快速钓鱼网页检测的问题。该方法主要从4个方面研究网页之间的关联性,主要指嵌在网页里的链接关联性、搜索关联性和文本关联性以及网页的整体关联性,把网页看作一个不可分割的整体,对其进行压缩处理,获取主要信息。经大量实验数据检验证明,该方法构建了一种高速高精度钓鱼网页检测方法,在保证高准确率的同时,显著减小网页检测时间。
-
公开(公告)号:CN102662959A
公开(公告)日:2012-09-12
申请号:CN201210057731.0
申请日:2012-03-07
Applicant: 南京邮电大学
Abstract: 一种基于空间混合索引机制的综合利用网页的空间布局、文字特征以及图像特征的钓鱼网页检测方法,涉及了一种基于页面视觉布局特征结合空间数据库的设计方案,主要解决了基于网页视觉相似性角度进行快速钓鱼网页检测的问题。方法结合浏览器渲染引擎,对指定的可疑网页进行视觉布局特征抽取,再利用空间数据库索引同步结合网页的文本特征以及图像特征,形成空间混合索引机制的综合文件图像倒排索引的空间树,即DIIR树。DIIR树是对空间索引机制的空间区域R树进行改进,在空间区域R树的每一个结点上添加网络对象中文字的倒排索引文件以及图像特征的倒排索引文件。在查询一个新的网络对象时并不仅仅考虑其空间布局特征,而是同步结合网络对象的文字特征以及图像特征。
-
公开(公告)号:CN101894134B
公开(公告)日:2012-04-11
申请号:CN201010204724.X
申请日:2010-06-21
Applicant: 南京邮电大学
IPC: G06F17/30
Abstract: 一种基于空间布局的钓鱼网页检测方法涉及了一种基于页面视觉布局特征结合空间数据库的设计方案,主要解决了基于网页视觉相似性角度进行快速钓鱼网页检测的问题,系统由5个模块组成,其中最上层是用户界面模块,主要负责获取用户输入并将结果反馈回用户,中间是控制模块,负责调度所有功能模块完成钓鱼网站检测。最核心的是3个功能模块,即:布局特征抽取模块、空间数据库模块、机器学习匹配模块。经大量实验数据检验证明,该方法构建了一种高速高精度钓鱼网页检测系统,在保证高准确率的同时,处理数据容量上有了重大提升,并显著减小网页检测时间。
-
公开(公告)号:CN102243659A
公开(公告)日:2011-11-16
申请号:CN201110200276.0
申请日:2011-07-18
Applicant: 南京邮电大学
IPC: G06F17/30
Abstract: 基于动态贝叶斯模型的网页垃圾检测方法涉及一种作弊网页检测的方法,主要采用一种改进的动态贝叶斯网络模型为用户点击行为建模,对作弊网页进行判断和识别,搜索引擎查询日志记录了用户与搜索引擎的交互信息。它的内容包括查询词、搜索引擎返回的网址、用户点击的网址以及时间戳等信息。日志中被点击的网址及其点击顺序等信息反映了用户的喜好。本发明为日志点击行为建模,挖掘搜索引擎返回列表序列中网址之间的点击因果关系,从用户的角度说明了哪些网址是用户认为和查询词相关联的,得到从用户角度出发的网页与查询的相关性,它是一种隐含的回馈,从而使作弊网页的排名位置靠后,而相关网页的排名则靠前了。
-
公开(公告)号:CN102129568A
公开(公告)日:2011-07-20
申请号:CN201110112414.X
申请日:2011-04-29
Applicant: 南京邮电大学
IPC: G06K9/62
Abstract: 利用改进的高斯混合模型分类器检测垃圾邮件的方法,利用健壮特征的加速提取算法来提取图片中垃圾信息的不变区域特征,对不变区域特征进行高斯混合模型拟合,使用期望最大化方法来进行权重、均值以及协方差矩阵的评估,具体为:对待检测数据集的图片进行标签,分为垃圾图片与正常图片;采用健壮特征的加速提取算法提取所有数据集的局部不变特征的向量;采用高斯混合模型对局部不变特征进行密度函数拟合,得到所有图片的均值与协方差矩阵;改进均值聚类算法,使其适用于对上一步骤中得出的特殊特征向量进行聚类,使用交叉熵作为分布之间相似度的衡量指标,实现基于高斯混合模型的均值聚类算法;利用基于高斯混合模型的均值聚类算法来构建分类器。
-
公开(公告)号:CN102103700A
公开(公告)日:2011-06-22
申请号:CN201110020901.3
申请日:2011-01-18
Applicant: 南京邮电大学
Abstract: 基于陆地移动距离的相似度检测图像型垃圾邮件的方法,利用了尺度不变特征转换算法来提取图片中垃圾信息的不变区域特征,使用陆地移动距离计算待测图片与垃圾邮件特征库中图片的相似度,从而检测出图像型垃圾邮件。本发明提供了一种使用图片的局部不变特征的基于陆地移动距离的相似度检测图像型垃圾邮件的方法。目前现有的利用相似度检测图像型垃圾邮件技术主要是使用欧式距离,而欧式距离无法处理结构大小可变的特征,需要先对特征进行聚类规范化特征,因此影响了检测速度。本发明利用陆地移动距离直接处理结构大小可变的局部不变特征,大大提高了图像型垃圾邮件的检测速度,同时保证了高精确度和低误判率。
-
公开(公告)号:CN101887523A
公开(公告)日:2010-11-17
申请号:CN201010204722.0
申请日:2010-06-21
Applicant: 南京邮电大学
Abstract: 利用图片的局部不变特征检测图像型垃圾邮件的方法,利用了尺度不变特征转换算法来提取图片中垃圾信息的不变区域特征,提取嵌入图片中文字来对图片进行分类,从而形成图片的两种特征结合的特征向量库。经过实验能够提高垃圾邮件的召回率,节省程序运算时间和空间。用这种方法来提取图片中的不变区域特征,从而生成图片的特征向量,使用支持向量机分类器来训练与测试。本发明提出的利用嵌入图片中的文本信息,使用图形文字识别技术挖掘出图片中的文本字符串,将字符串作为图片的特征,使用贝叶斯分类器来训练与测试。每张图片的特征向量是由图片的局部不变特征与文本字符串构成的,使用堆栈方法综合两种分类器进行分类,来检测图像型垃圾邮件的实现方法。
-
公开(公告)号:CN115129320B
公开(公告)日:2024-05-24
申请号:CN202210686923.1
申请日:2022-06-17
Applicant: 南京邮电大学
Abstract: 本发明提供了一种基于循环不变式的间接跳转目标地址识别方法及装置。方法包括:将二进制程序解码成中间表示BRIL;根据BRIL语义和控制流结构计算循环不变式,并将其保存到分析树的结点中;深度优先遍历分析树,将循环不变式不断约简合并,生成约束表达式集;对约束表达式集求解,得到间接跳转目标地址;将目标地址处的语句作为分析入口,目标地址作为初始值,重新进行分析树的构建、约束表达式集的生成和求解,直到间接跳转目标地址不再发生变化(不动点)。本发明相比于传统数据流分析的方法,利用循环不变式来增加对地址数据的分析深度,并能够减少对循环结构的分析次数,从而提高间接跳转目标地址识别的准确度和效率。
-
-
-
-
-
-
-
-
-