-
公开(公告)号:CN104598586B
公开(公告)日:2018-04-17
申请号:CN201510024552.0
申请日:2015-01-18
Applicant: 北京工业大学
Abstract: 大规模文本分类的方法涉及计算机领域,为实现兼顾精度的大规模学习,需要通过构建具有最大差异性的多个分类器及实现多个分类器的高效集成决策来实现。该大规模文本分类的方法包括:将文本数据转换为向量数据,分割大规模文本数据集为子集;以分布式计算的方法使用子集训练子分类器;选择分类器;对待测样本进行分类,实现多分类器共同决策。本发明将集成学习框架应用于大规模文本分类上,可以使现有的分类方法适用于大规模文本分类,提高分类效率。
-
公开(公告)号:CN104598586A
公开(公告)日:2015-05-06
申请号:CN201510024552.0
申请日:2015-01-18
Applicant: 北京工业大学
CPC classification number: G06F17/3071 , G06K9/6227
Abstract: 大规模文本分类的方法涉及计算机领域,为实现兼顾精度的大规模学习,需要通过构建具有最大差异性的多个分类器及实现多个分类器的高效集成决策来实现。该大规模文本分类的方法包括:将文本数据转换为向量数据,分割大规模文本数据集为子集;以分布式计算的方法使用子集训练子分类器;选择分类器;对待测样本进行分类,实现多分类器共同决策。本发明将集成学习框架应用于大规模文本分类上,可以使现有的分类方法适用于大规模文本分类,提高分类效率。
-