-
公开(公告)号:CN111400180A
公开(公告)日:2020-07-10
申请号:CN202010177397.7
申请日:2020-03-13
Applicant: 上海海事大学
Abstract: 本发明公开了一种基于特征集划分和集成学习的软件缺陷预测方法,该方法将原始数据集划分为训练数据集和测试数据集,将训练数据集分为若干个特征子集;选择K个基分类器用于集成学习,再根据基分类器及其对应的权重合成每个特征子集的集成分类器;选择出与输入实例最相似的特征子集,并以其集成分类器对输入实例进行缺陷预测,建立软件缺陷预测模型;对测试数据集进行划分并寻找与输入实例最相似的特征子集;搜索质心集和权重集的最优取值,结合测试数据集的最相似特征子集,优化软件缺陷预测模型。其优点是:该方法不仅可以移除缺陷预测数据集中的冗余特征,减小算法的搜索空间,还可以有效缓解软件缺陷历史数据特征维度高的问题。
-
公开(公告)号:CN111400180B
公开(公告)日:2023-03-10
申请号:CN202010177397.7
申请日:2020-03-13
Applicant: 上海海事大学
IPC: G06F11/36 , G06F18/241 , G06F18/214 , G06N3/126
Abstract: 本发明公开了一种基于特征集划分和集成学习的软件缺陷预测方法,该方法将原始数据集划分为训练数据集和测试数据集,将训练数据集分为若干个特征子集;选择K个基分类器用于集成学习,再根据基分类器及其对应的权重合成每个特征子集的集成分类器;选择出与输入实例最相似的特征子集,并以其集成分类器对输入实例进行缺陷预测,建立软件缺陷预测模型;对测试数据集进行划分并寻找与输入实例最相似的特征子集;搜索质心集和权重集的最优取值,结合测试数据集的最相似特征子集,优化软件缺陷预测模型。其优点是:该方法不仅可以移除缺陷预测数据集中的冗余特征,减小算法的搜索空间,还可以有效缓解软件缺陷历史数据特征维度高的问题。
-