-
公开(公告)号:CN102098235B
公开(公告)日:2013-08-07
申请号:CN201110020896.6
申请日:2011-01-18
Applicant: 南京邮电大学
Abstract: 基于文本特征分析的钓鱼邮件检测方法,去除掉邮件中的非文本内容;利用了邮件解析器对邮件进行解析;利用了正则表达式算法提取了邮件中的网站链接;再次利用正则表达式算法提取了链接中的相关特征;利用域名注册检索引擎,得到了网站注册时间特征。运用这些所提取的文本特征,组成邮件的特征向量。通过实验,证明能够提高钓鱼邮件的精度和召回率,并节省程序运行的时间和开销。本发明从以往的这些文本特征中进行了筛选,将效果比较好的几个特征挑选出来,并结合钓鱼邮件的特点和现有的研究基础提出几种新的针对钓鱼邮件检测的文本特征。使用本发明对可疑邮件进行检测。
-
公开(公告)号:CN102306144B
公开(公告)日:2013-05-08
申请号:CN201110200321.2
申请日:2011-07-18
Applicant: 南京邮电大学
IPC: G06F17/27
Abstract: 一种基于语义词典的词语消歧方法,提出了基于语义词典的词语消歧方法,所提出的方法利用对词语概念相关度的计算,实现自动文本摘要的预处理工作——词语消歧,利用概念的相关关系实现语义消歧的方法,综合考虑概念、概念释义、概念的同义词、概念的扩展释义及扩展概念的同义词集合等因素及句子的连贯度要求,利用概念的相关度计算公式和回溯法选取单词的最佳词义,实现基于上下文的语义消歧。经过实验能够提高语义消歧的召回率和准确率,更好的服务于文本摘要的获取。
-
公开(公告)号:CN102129479B
公开(公告)日:2013-01-02
申请号:CN201110112383.8
申请日:2011-04-29
Applicant: 南京邮电大学
Abstract: 一种基于概率潜在语义分析模型的Web服务发现方法利用了概率潜在语义分析模型对解析后的Web服务描述性文档进行建模分析,挖掘隐藏在服务描述背后的语义概念,进行语义聚类,在较先进的概念层次将请求服务和服务集中的服务进行相似性匹配,并且结合了语法层次上的谱聚类,在语义聚类之前以一种基于谱聚类的算法对服务数据集进行无关数据的滤除,从而压缩了计算的复杂性。经过试验证明,此方法在服务发现的查准率和查全率方面都有着很好的表现。
-
公开(公告)号:CN102629261A
公开(公告)日:2012-08-08
申请号:CN201210051171.8
申请日:2012-03-01
Applicant: 南京邮电大学
IPC: G06F17/30
Abstract: 本发明是一种由钓鱼网页查找目标网页的方法,首先从网页文本和网页图片中提取关键词,组成该钓鱼网页的词汇签名,然后在多个搜索引擎上用词汇签名进行检索,综合这些搜索引擎的结果,找出最相近的前K个网页,将这K个网页和钓鱼网页以图片形式保存,提取图像感知哈希序列,最后分别计算这K个网页图片与钓鱼网页图片之间的海明距离,根据距离的大小可以选出该钓鱼网页模仿的一个或者多个合法网页,即目标网页。
-
公开(公告)号:CN102629230A
公开(公告)日:2012-08-08
申请号:CN201210057825.8
申请日:2012-03-07
Applicant: 南京邮电大学
IPC: G06F11/36
Abstract: 基于多特征缺陷再分配图分配缺陷报告的方法综合运用机器学习模型和缺陷再分配图预测缺陷修复人员,用已修复的缺陷报告中开发人员之间的再分配关系,将再分配关系转化为缺陷再分配图,使用机器学习模型预测完缺陷报告开发人员后,结合缺陷再分配图更新缺陷报告开发人员,完成缺陷报告修复人员的预测;具体方法为以下步骤:步骤1)对选取的缺陷报告数据集进行分类,分为训练集和测试集;步骤2)用训练集来训练机器学习模型和创建缺陷再分配图;步骤3)用机器学习模型预测测试集的缺陷修复人员;步骤4)结合缺陷再分配图更新缺陷修复人员;通过使用本发明的方法,能有效地减少缺陷再分配的路径长度,提高缺陷分配的预测精度,降低缺陷修复人员搜索的失败率。
-
公开(公告)号:CN102306144A
公开(公告)日:2012-01-04
申请号:CN201110200321.2
申请日:2011-07-18
Applicant: 南京邮电大学
IPC: G06F17/27
Abstract: 一种基于语义词典的词语消歧方法,提出了基于语义词典的词语消歧方法,所提出的方法利用对词语概念相关度的计算,实现自动文本摘要的预处理工作——词语消歧,利用概念的相关关系实现语义消歧的方法,综合考虑概念、概念释义、概念的同义词、概念的扩展释义及扩展概念的同义词集合等因素及句子的连贯度要求,利用概念的相关度计算公式和回溯法选取单词的最佳词义,实现基于上下文的语义消歧。经过实验能够提高语义消歧的召回率和准确率,更好的服务于文本摘要的获取。
-
公开(公告)号:CN102129479A
公开(公告)日:2011-07-20
申请号:CN201110112383.8
申请日:2011-04-29
Applicant: 南京邮电大学
Abstract: 一种基于概率潜在语义分析模型的Web服务发现方法利用了概率潜在语义分析模型对解析后的Web服务描述性文档进行建模分析,挖掘隐藏在服务描述背后的语义概念,进行语义聚类,在较先进的概念层次将请求服务和服务集中的服务进行相似性匹配,并且结合了语法层次上的谱聚类,在语义聚类之前以一种基于谱聚类的算法对服务数据集进行无关数据的滤除,从而压缩了计算的复杂性。经过试验证明,此方法在服务发现的查准率和查全率方面都有着很好的表现。
-
公开(公告)号:CN115098108B
公开(公告)日:2024-12-24
申请号:CN202210710437.9
申请日:2022-06-22
Applicant: 南京邮电大学
IPC: G06F8/41
Abstract: 本发明公开了一种基于高阶函数的轻量级上下文敏感指针分析方法,包括:确定函数分析顺序;根据函数分析顺序收集上下文不敏感的指向约束;收集上下文敏感的指向约束;求解上下文不敏感的指向约束和上下文敏感的指向约束得到被调用函数的指向信息分析结果,并以高阶函数形式保存;判断函数是否全部分析完毕,若未分析完毕,则继续收集其他函数的指向约束;否则,则输出指针分析结果;本发明可以避免现有方法中为解决间接引用问题额外引入辅助变量和映射表,从而高效地进行上下文敏感指针分析。
-
公开(公告)号:CN102662959B
公开(公告)日:2014-07-16
申请号:CN201210057731.0
申请日:2012-03-07
Applicant: 南京邮电大学
Abstract: 一种基于空间混合索引机制的综合利用网页的空间布局、文字特征以及图像特征的钓鱼网页检测方法,涉及了一种基于页面视觉布局特征结合空间数据库的设计方案,主要解决了基于网页视觉相似性角度进行快速钓鱼网页检测的问题。方法结合浏览器渲染引擎,对指定的可疑网页进行视觉布局特征抽取,再利用空间数据库索引同步结合网页的文本特征以及图像特征,形成空间混合索引机制的综合文件图像倒排索引的空间树,即DIIR树。DIIR树是对空间索引机制的空间区域R树进行改进,在空间区域R树的每一个结点上添加网络对象中文字的倒排索引文件以及图像特征的倒排索引文件。在查询一个新的网络对象时并不仅仅考虑其空间布局特征,而是同步结合网络对象的文字特征以及图像特征。
-
-
-
-
-
-
-
-