一种应用于不平衡数据的自适应集成学习分类方法

    公开(公告)号:CN119202949A

    公开(公告)日:2024-12-27

    申请号:CN202411551532.4

    申请日:2024-11-01

    Abstract: 本发明提出一种应用于不平衡数据的自适应集成学习分类方法,包括以下步骤:对原始数据进行预处理并提取负类数据和正类数据;然后分别划分为训练集、验证集和测试集;利用滑动窗口对正类和负类的训练集提取特征;对其中的负类聚类后对样本随机欠采样;将欠采样后的样本和相同特征子集下的正类训练集样本组合;选择随机森林为基分类器并利用组合的训练集进行训练;利用正类和负类的验证集组合计算基分类器的交叉熵损失并为每一个基分类器分配权重;利用正类和负类测试集组合进行加权投票,得到预测标签以进行指标计算。本发明结合特征子集的多样性提取和聚类欠采样技术,在面对不平衡数据集的分类问题时能提高对少数类样本的识别能力,优化分类性能。

Patent Agency Ranking