-
公开(公告)号:CN116126939A
公开(公告)日:2023-05-16
申请号:CN202310003668.0
申请日:2023-01-03
Applicant: 安徽工业大学
IPC: G06F16/2458 , G06F16/215 , G06F16/28
Abstract: 本发明提供一种带有两步噪声过滤的不平衡数据混合采样算法,将原始数据集T划分多数类数据集M和少数类数据集Q,把少数类数据集Q进行类别分类,分为安全少数类数据集Qsafe和边界少数类数据集Qborder,把多数类数据集M进行类别分类,分为边界多数类数据集Mborder和主要多数类数据集maj,对Qsafe和Qborder使用不同的方法生成新样本目的是为了减少合成样本与原始数据集T中的边界多数类数据集Mborder样本重叠的概率,提高对于边界样本的识别准确度,使合成的样本分布更均匀,进而提升分类器的识别性能。根据不同的噪声过滤机制进行的两步噪声去噪,可以更充分的过滤数据集T中的噪声样本,减少噪声样本对数据分类性能的影响。