-
公开(公告)号:CN119475097A
公开(公告)日:2025-02-18
申请号:CN202411664305.2
申请日:2024-11-20
Applicant: 南京邮电大学
IPC: G06F18/2415 , G06F18/214 , G06N20/20 , G16H50/30 , G16H50/70
Abstract: 本发明涉及一种基于迭代式的欠采样代价敏感集成分类方法,属于医疗数据分析技术领域,尤其适用于处理不平衡数据集中的疾病预测模型。本发明通过迭代式的欠采样策略,动态调整多数类样本的采样概率,确保在训练过程中重点关注少数类样本的特征,同时避免丢失多数类样本的重要信息。结合代价敏感学习和集成学习,提出了一种能够在保持分类器整体准确率的同时,显著提高少数类样本预测性能的分类方法。该方法具有良好的适应性,适用于多种不平衡数据集场景,在医疗数据分析和疾病预警中展现了出色的应用效果。