非平衡样本分类的集成迁移学习方法

    公开(公告)号:CN102521656A

    公开(公告)日:2012-06-27

    申请号:CN201110452050.X

    申请日:2011-12-29

    Abstract: 一种非平衡样本分类的集成迁移学习方法:在初始化时,将正负样本赋予不同的权重,保证占总样本比例小但信息量大的负样本初始权重大。每轮训练过程中按比例抽取部分样本作为训练子集进行训练,训练结束后,从若干个简单分类器中选择误差最小的那个,作为一个弱分类器,并按照冗余数据动态剔除算法调整训练数据集,经过T轮迭代后得到一个弱分类器序列,将多个弱分类器叠加起来组合成一个强分类器。本发明有效利用已有旧数据的分类规律找出近似分布的新数据的分类规律,尤其是针对分类不平衡数据的分类问题提供了新的方法,保证了分类中数量少的负样本在分类训练中的作用,有效地提高了负样本的贡献率,提高了分类的效率和精度。

    非平衡样本分类的集成迁移学习方法

    公开(公告)号:CN102521656B

    公开(公告)日:2014-02-26

    申请号:CN201110452050.X

    申请日:2011-12-29

    Abstract: 一种非平衡样本分类的集成迁移学习方法:在初始化时,将正负样本赋予不同的权重,保证占总样本比例小但信息量大的负样本初始权重大。每轮训练过程中按比例抽取部分样本作为训练子集进行训练,训练结束后,从若干个简单分类器中选择误差最小的那个,作为一个弱分类器,并按照冗余数据动态剔除算法调整训练数据集,经过T轮迭代后得到一个弱分类器序列,将多个弱分类器叠加起来组合成一个强分类器。本发明有效利用已有旧数据的分类规律找出近似分布的新数据的分类规律,尤其是针对分类不平衡数据的分类问题提供了新的方法,保证了分类中数量少的负样本在分类训练中的作用,有效地提高了负样本的贡献率,提高了分类的效率和精度。

Patent Agency Ranking