-
公开(公告)号:CN117312848A
公开(公告)日:2023-12-29
申请号:CN202311217587.7
申请日:2023-09-20
Applicant: 苏州大学
IPC: G06F18/214 , G06F18/23213 , G06F11/36
Abstract: 本发明涉及一种软件缺陷数据生成方法和系统,方法包括:步骤S1:获取软件数据集,其中,所述软件数据集包括缺陷数据集和非缺陷数据集,将所述缺陷数据集作为少数类数据集,将所述非缺陷数据集作为多数类数据集;步骤S2:对所述缺陷数据集和非缺陷数据集进行过采样,生成所需的新的缺陷样本,将新的缺陷样本放入缺陷数据集中,使放入新的缺陷样本后的缺陷数据集的样本点和非缺陷数据集的样本点达到平衡。本发明能够将软件数据集中的缺陷数据集和非缺陷数据集达到平衡,实验证明,本发明构造出的新的缺陷数据集能够使得用于软件缺陷预测的模型学习到有区分度的信息,保证模型的高效性。