-
公开(公告)号:CN102629230B
公开(公告)日:2015-04-01
申请号:CN201210057825.8
申请日:2012-03-07
Applicant: 南京邮电大学
IPC: G06F11/36
Abstract: 基于多特征缺陷再分配图分配缺陷报告的方法综合运用机器学习模型和缺陷再分配图预测缺陷修复人员,用已修复的缺陷报告中开发人员之间的再分配关系,将再分配关系转化为缺陷再分配图,使用机器学习模型预测完缺陷报告开发人员后,结合缺陷再分配图更新缺陷报告开发人员,完成缺陷报告修复人员的预测;具体方法为以下步骤:步骤1)对选取的缺陷报告数据集进行分类,分为训练集和测试集;步骤2)用训练集来训练机器学习模型和创建缺陷再分配图;步骤3)用机器学习模型预测测试集的缺陷修复人员;步骤4)结合缺陷再分配图更新缺陷修复人员;通过使用本发明的方法,能有效地减少缺陷再分配的路径长度,提高缺陷分配的预测精度,降低缺陷修复人员搜索的失败率。
-
公开(公告)号:CN102629261A
公开(公告)日:2012-08-08
申请号:CN201210051171.8
申请日:2012-03-01
Applicant: 南京邮电大学
IPC: G06F17/30
Abstract: 本发明是一种由钓鱼网页查找目标网页的方法,首先从网页文本和网页图片中提取关键词,组成该钓鱼网页的词汇签名,然后在多个搜索引擎上用词汇签名进行检索,综合这些搜索引擎的结果,找出最相近的前K个网页,将这K个网页和钓鱼网页以图片形式保存,提取图像感知哈希序列,最后分别计算这K个网页图片与钓鱼网页图片之间的海明距离,根据距离的大小可以选出该钓鱼网页模仿的一个或者多个合法网页,即目标网页。
-
公开(公告)号:CN102629230A
公开(公告)日:2012-08-08
申请号:CN201210057825.8
申请日:2012-03-07
Applicant: 南京邮电大学
IPC: G06F11/36
Abstract: 基于多特征缺陷再分配图分配缺陷报告的方法综合运用机器学习模型和缺陷再分配图预测缺陷修复人员,用已修复的缺陷报告中开发人员之间的再分配关系,将再分配关系转化为缺陷再分配图,使用机器学习模型预测完缺陷报告开发人员后,结合缺陷再分配图更新缺陷报告开发人员,完成缺陷报告修复人员的预测;具体方法为以下步骤:步骤1)对选取的缺陷报告数据集进行分类,分为训练集和测试集;步骤2)用训练集来训练机器学习模型和创建缺陷再分配图;步骤3)用机器学习模型预测测试集的缺陷修复人员;步骤4)结合缺陷再分配图更新缺陷修复人员;通过使用本发明的方法,能有效地减少缺陷再分配的路径长度,提高缺陷分配的预测精度,降低缺陷修复人员搜索的失败率。
-
公开(公告)号:CN102637143B
公开(公告)日:2014-12-10
申请号:CN201210057888.3
申请日:2012-03-07
Applicant: 南京邮电大学
IPC: G06F11/36
Abstract: 基于改进的支持向量机的软件缺陷优先级预测方法主要采用一种改进的支持向量机模型为缺陷优先级的预测建模,对缺陷报告的处理优先级进行判断和预测,步骤1)选取状态为已解决的,已关闭的,已确定的错误报告做为训练数据;步骤2)提取出我们需要的特征;步骤3)对所有样本赋以一个抽样权重在此样本上用支持向量机训练一个分类器对样本分类,步骤4)用得到的错误率去更新分布权值向量:对错误分类的样本分配更大的权值,正确分类的样本赋予更小的权值。步骤5)就这样依次迭代,最后我们得到的强分类器就是多个弱分类器的加权和。本发明用机器学习的发法训练出分类器,从而使缺陷优先级的确定自动化,减少人员和成本的消耗。
-
公开(公告)号:CN102629261B
公开(公告)日:2014-07-16
申请号:CN201210051171.8
申请日:2012-03-01
Applicant: 南京邮电大学
IPC: G06F17/30
Abstract: 本发明是一种由钓鱼网页查找目标网页的方法,首先从网页文本和网页图片中提取关键词,组成该钓鱼网页的词汇签名,然后在多个搜索引擎上用词汇签名进行检索,综合这些搜索引擎的结果,找出最相近的前K个网页,将这K个网页和钓鱼网页以图片形式保存,提取图像感知哈希序列,最后分别计算这K个网页图片与钓鱼网页图片之间的海明距离,根据距离的大小可以选出该钓鱼网页模仿的一个或者多个合法网页,即目标网页。
-
公开(公告)号:CN102637143A
公开(公告)日:2012-08-15
申请号:CN201210057888.3
申请日:2012-03-07
Applicant: 南京邮电大学
IPC: G06F11/36
Abstract: 基于改进的支持向量机的软件缺陷优先级预测方法主要采用一种改进的支持向量机模型为缺陷优先级的预测建模,对缺陷报告的处理优先级进行判断和预测,步骤1)选取状态为已解决的,已关闭的,已确定的错误报告做为训练数据;步骤2)提取出我们需要的特征;步骤3)对所有样本赋以一个抽样权重在此样本上用支持向量机训练一个分类器对样本分类,步骤4)用得到的错误率去更新分布权值向量:对错误分类的样本分配更大的权值,正确分类的样本赋予更小的权值。步骤5)就这样依次迭代,最后我们得到的强分类器就是多个弱分类器的加权和。本发明用机器学习的发法训练出分类器,从而使缺陷优先级的确定自动化,减少人员和成本的消耗。
-
公开(公告)号:CN102662959B
公开(公告)日:2014-07-16
申请号:CN201210057731.0
申请日:2012-03-07
Applicant: 南京邮电大学
Abstract: 一种基于空间混合索引机制的综合利用网页的空间布局、文字特征以及图像特征的钓鱼网页检测方法,涉及了一种基于页面视觉布局特征结合空间数据库的设计方案,主要解决了基于网页视觉相似性角度进行快速钓鱼网页检测的问题。方法结合浏览器渲染引擎,对指定的可疑网页进行视觉布局特征抽取,再利用空间数据库索引同步结合网页的文本特征以及图像特征,形成空间混合索引机制的综合文件图像倒排索引的空间树,即DIIR树。DIIR树是对空间索引机制的空间区域R树进行改进,在空间区域R树的每一个结点上添加网络对象中文字的倒排索引文件以及图像特征的倒排索引文件。在查询一个新的网络对象时并不仅仅考虑其空间布局特征,而是同步结合网络对象的文字特征以及图像特征。
-
公开(公告)号:CN102662959A
公开(公告)日:2012-09-12
申请号:CN201210057731.0
申请日:2012-03-07
Applicant: 南京邮电大学
Abstract: 一种基于空间混合索引机制的综合利用网页的空间布局、文字特征以及图像特征的钓鱼网页检测方法,涉及了一种基于页面视觉布局特征结合空间数据库的设计方案,主要解决了基于网页视觉相似性角度进行快速钓鱼网页检测的问题。方法结合浏览器渲染引擎,对指定的可疑网页进行视觉布局特征抽取,再利用空间数据库索引同步结合网页的文本特征以及图像特征,形成空间混合索引机制的综合文件图像倒排索引的空间树,即DIIR树。DIIR树是对空间索引机制的空间区域R树进行改进,在空间区域R树的每一个结点上添加网络对象中文字的倒排索引文件以及图像特征的倒排索引文件。在查询一个新的网络对象时并不仅仅考虑其空间布局特征,而是同步结合网络对象的文字特征以及图像特征。
-
-
-
-
-
-
-