Invention Publication
- Patent Title: 适用于海量不均衡缺陷报告的软件缺陷严重程度预测方法
-
Application No.: CN202110281981.1Application Date: 2021-03-16
-
Publication No.: CN112905478APublication Date: 2021-06-04
- Inventor: 陈翔 , 葛骅 , 陈晓红 , 贾焱鑫 , 林浩
- Applicant: 南通大学
- Applicant Address: 江苏省南通市崇川区啬园路9号
- Assignee: 南通大学
- Current Assignee: 南通大学
- Current Assignee Address: 江苏省南通市崇川区啬园路9号
- Agency: 南京经纬专利商标代理有限公司
- Agent 沈海霞
- Main IPC: G06F11/36
- IPC: G06F11/36 ; G06F16/35 ; G06F40/284 ; G06F40/211

Abstract:
本发明公开了一种适用于海量不均衡缺陷报告的软件缺陷严重程度预测方法,包括以下步骤:1.构建缺陷报告数据集DBR;步骤2.构建缺陷报告样本集;步骤3.利用borderline‑smote算法实现建缺陷报告样本集中的样本均衡;步骤4.利用均衡后的缺陷报告样本集训练逻辑回归模型得到缺陷报告严重程度预测模型;步骤5.利用缺陷报告严重程度预测模型对新缺陷报告进行预测:利用引入了维基百科的语料库的bert模型将缺陷报告中描述信息生成仅有768维句子向量,同时利用borderline‑smote算法实现了由句子向量及严重程度构成的样本集中各类样本的均衡,提高软件缺陷严重程度预模型的训练效率及检测准确性。
Information query