-
公开(公告)号:CN110543563A
公开(公告)日:2019-12-06
申请号:CN201910767580.X
申请日:2019-08-20
Applicant: 暨南大学
Abstract: 本发明公开了一种层次型文本分类方法及系统,方法包括步骤:根据文本类标签的树型层次结构,给文本类标签层次树中的类标签节点编号;在每个非叶节点上训练分类器,分类器输出初步预测类标签概率向量,向量元素代表该文本被分为每一个类标签的概率;然后利用文本类标签之间的联系,训练调整概率矩阵,调整概率矩阵中元素是类标签被调整为各个类标签的概率;通过训练得到的调整概率矩阵对文本类标签进行全局统筹修正,构建全局层次型文本分类模型。本发明打通了类标签层与层之间的联系,可以使文本类别预测错误率在每一层都有所减少,提高层次型文本分类的准确率。
-
公开(公告)号:CN110543563B
公开(公告)日:2022-03-08
申请号:CN201910767580.X
申请日:2019-08-20
Applicant: 暨南大学
Abstract: 本发明公开了一种层次型文本分类方法及系统,方法包括步骤:根据文本类标签的树型层次结构,给文本类标签层次树中的类标签节点编号;在每个非叶节点上训练分类器,分类器输出初步预测类标签概率向量,向量元素代表该文本被分为每一个类标签的概率;然后利用文本类标签之间的联系,训练调整概率矩阵,调整概率矩阵中元素是类标签被调整为各个类标签的概率;通过训练得到的调整概率矩阵对文本类标签进行全局统筹修正,构建全局层次型文本分类模型。本发明打通了类标签层与层之间的联系,可以使文本类别预测错误率在每一层都有所减少,提高层次型文本分类的准确率。
-