面向不平衡数据的自步半监督集成分类器训练方法及系统

    公开(公告)号:CN116910660B

    公开(公告)日:2024-01-23

    申请号:CN202311145834.7

    申请日:2023-09-07

    Abstract: 本发明提供了一种面向不平衡数据的自步半监督集成分类器训练方法及系统,其属于数据处理技术领域,该方案通过结合分类器和加权k近邻确定安全的伪标注样本,来提高伪标注样本的质量;然后,使用基于聚类的自步学习选择伪标注样本,有效提高添加的伪标注样本的多样性并缓解错误积累;最后,利用增强后的平衡样本集训练基分类器并集成,来缓解由不平衡的类分布造成的分类器偏差,特别是对于医疗领域的图像分类、征信风险评估领域的风险评估等经常存在数据样本不平衡的情况下,能够有效保证训练后分类器分类结果的准确性。(56)对比文件Hongjiao Guan 等.A GeneralizedOptimization Embedded Framework ofUnfersampling Ensembles for ImbalancedClassification《.researchGate》.2021,第1-10页.Yangguang Shao.Dual Self-Paced SMOTEfor Imbalanced Data《.2022 26thInternational Conference on PattenRecognition》.2022,第3083-3089页.

Patent Agency Ranking