基于集成学习的多标签分类方法

    公开(公告)号:CN106971201A

    公开(公告)日:2017-07-21

    申请号:CN201710178952.6

    申请日:2017-03-23

    Abstract: 本发明公开一种基于集成学习的多标签分类方法,包括以下步骤:预先设置参数m,k,t;然后对原始训练样本集进行聚类,根据聚类结果计算标签的重要性程度;再依据标签重要性程度,从原始训练集中获取m个训练集学习基分类器;最后将基分类器的训练结果进行集成,得到最终的分类结果。本发明在已知训练样本及其标签的情况下,通过聚类的方法预先学习样本的属性,因为在多标签的问题中,一组标签其实是属性的另一种表达,建立这种标签表达属性的关系,也即哪些标签可以表达什么样的属性,可以保证在后续的集成学习过程中基分类器的训练集之间的多样性。

Patent Agency Ranking