重采样与代价敏感学习融合的不平衡数据集成分类方法

    公开(公告)号:CN107545275A

    公开(公告)日:2018-01-05

    申请号:CN201710622978.5

    申请日:2017-07-27

    Inventor: 余志文 温馨

    Abstract: 本发明公开了一种将重采样技术与代价敏感学习融合的不平衡数据集成分类方法,涉及人工智能集成学习领域,主要解决现有技术中利用完整数据信息的不平衡数据分类问题,所述方法步骤为:(1)输入训练数据集;(2)计算样本空间分布的相对密度;(3)重采样生成多个子集并训练基础分类器;(4)计算测试样本的相似性矩阵;(5)使用多目标优化并集成得到先验结果;(6)对测试集进行代价敏感学习预测;(7)使用KL散度将结果进行优化融合。所述方法设计了一种新的采样方法解决数据分布不平衡的问题;利用同时结合重采样技术和代价敏感学习的方法解决信息不完整的问题;并充分利用测试集本身的数据信息提高了集成分类器的性能。

Patent Agency Ranking