适用于海量不均衡缺陷报告的软件缺陷严重程度预测方法
Abstract:
本发明公开了一种适用于海量不均衡缺陷报告的软件缺陷严重程度预测方法,包括以下步骤:1.构建缺陷报告数据集DBR;步骤2.构建缺陷报告样本集;步骤3.利用borderline‑smote算法实现建缺陷报告样本集中的样本均衡;步骤4.利用均衡后的缺陷报告样本集训练逻辑回归模型得到缺陷报告严重程度预测模型;步骤5.利用缺陷报告严重程度预测模型对新缺陷报告进行预测:利用引入了维基百科的语料库的bert模型将缺陷报告中描述信息生成仅有768维句子向量,同时利用borderline‑smote算法实现了由句子向量及严重程度构成的样本集中各类样本的均衡,提高软件缺陷严重程度预模型的训练效率及检测准确性。
Patent Agency Ranking
0/0