-
公开(公告)号:CN111400180B
公开(公告)日:2023-03-10
申请号:CN202010177397.7
申请日:2020-03-13
Applicant: 上海海事大学
IPC: G06F11/36 , G06F18/241 , G06F18/214 , G06N3/126
Abstract: 本发明公开了一种基于特征集划分和集成学习的软件缺陷预测方法,该方法将原始数据集划分为训练数据集和测试数据集,将训练数据集分为若干个特征子集;选择K个基分类器用于集成学习,再根据基分类器及其对应的权重合成每个特征子集的集成分类器;选择出与输入实例最相似的特征子集,并以其集成分类器对输入实例进行缺陷预测,建立软件缺陷预测模型;对测试数据集进行划分并寻找与输入实例最相似的特征子集;搜索质心集和权重集的最优取值,结合测试数据集的最相似特征子集,优化软件缺陷预测模型。其优点是:该方法不仅可以移除缺陷预测数据集中的冗余特征,减小算法的搜索空间,还可以有效缓解软件缺陷历史数据特征维度高的问题。
-
公开(公告)号:CN110674631A
公开(公告)日:2020-01-10
申请号:CN201910899785.3
申请日:2019-09-23
Applicant: 上海海事大学
IPC: G06F40/216 , G06F16/35 , G06Q10/06
Abstract: 本发明公开了一种基于版本提交信息的软件缺陷自动分派方法,包括以下步骤:步骤1:提取commit信息和bug信息,并建立commit信息模型和bug信息模型;步骤2:bug信息模型基于LDA模型进行计算,得到bug-topic列表;步骤3:对commit信息模型和bug信息模型进行相似度匹配,得出bug-fixer列表;步骤4:将bug-topic列表与bug-fixer列表相互映射,得到fixer-topic列表;步骤5:任意一种bug信息对应的bug-topic列表通过fixer-topic列表进行分派比对,匹配出合适的软件缺陷修复者。此方法解决了源码文件定位准确率低和修复者工作量巨大的问题,充分挖掘commit库中有价值的信息,精准定位源码文件及其开发者,有效的提高了缺陷分派的准确度,实现了软件缺陷的自动分派,减小了修复者的工作量。
-
公开(公告)号:CN111400180A
公开(公告)日:2020-07-10
申请号:CN202010177397.7
申请日:2020-03-13
Applicant: 上海海事大学
Abstract: 本发明公开了一种基于特征集划分和集成学习的软件缺陷预测方法,该方法将原始数据集划分为训练数据集和测试数据集,将训练数据集分为若干个特征子集;选择K个基分类器用于集成学习,再根据基分类器及其对应的权重合成每个特征子集的集成分类器;选择出与输入实例最相似的特征子集,并以其集成分类器对输入实例进行缺陷预测,建立软件缺陷预测模型;对测试数据集进行划分并寻找与输入实例最相似的特征子集;搜索质心集和权重集的最优取值,结合测试数据集的最相似特征子集,优化软件缺陷预测模型。其优点是:该方法不仅可以移除缺陷预测数据集中的冗余特征,减小算法的搜索空间,还可以有效缓解软件缺陷历史数据特征维度高的问题。
-
-