-
公开(公告)号:CN114117040A
公开(公告)日:2022-03-01
申请号:CN202111315298.1
申请日:2021-11-08
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种基于标签特定特征和标签相关性的文本数据多标签分类方法,包括:101对文本数据进行预处理,结合实例标签空间和特征空间构造新的实例特征空间;102对正负实例特征空间计算聚类个数,并构造标签特定特征;103对文本数据集中成对标签计算相关性,构造标签间相关性无向完全图;104采用扩展Kruskal算法在图中计算最大生成树集合;105从树集合中依次选择生成树,并从根节点开始使用二分类器在树上进行递归预测,对预测结果进行树上集成得出文本实例标签集。本发明能够有效的抑制预测过程中的误差传递问题,并且采用树集合集成预测,能够有效的利用标签集合间不同的相关性,进一步提高多标签分类的性能。