-
公开(公告)号:CN109271517B
公开(公告)日:2021-12-31
申请号:CN201811147525.2
申请日:2018-09-29
Applicant: 东北大学
IPC: G06F16/35 , G06F40/279
Abstract: 本发明具体涉及一种IG TF‑IDF文本特征向量生成及文本分类方法,属于文本挖掘和机器学习领域。所述方法包括:1)生成文本特征向量;2)训练分类器;3)评估分类性能;4)对目标文本集进行分类;本发明计算所得权重更能真实的反映不同词条对文本分类的重要程度,使得具有强类别区分能力的词条被分配更大的权重,使得权重计算更加合理,从而提高了文本分类的准确度;而且计算所得词条权重无需知道具体所述类别,克服了TFADF等有监督方法在多类别文本中分类的不足。
-
公开(公告)号:CN109271517A
公开(公告)日:2019-01-25
申请号:CN201811147525.2
申请日:2018-09-29
Applicant: 东北大学
Abstract: 本发明具体涉及一种IG TF-IDF文本特征向量生成及文本分类方法,属于文本挖掘和机器学习领域。所述方法包括:1)生成文本特征向量;2)训练分类器;3)评估分类性能;4)对目标文本集进行分类;本发明计算所得权重更能真实的反映不同词条对文本分类的重要程度,使得具有强类别区分能力的词条被分配更大的权重,使得权重计算更加合理,从而提高了文本分类的准确度;而且计算所得词条权重无需知道具体所述类别,克服了TFADF等有监督方法在多类别文本中分类的不足。
-