一种优化的高精度文本分类方法及装置

    公开(公告)号:CN114579746B

    公开(公告)日:2024-08-13

    申请号:CN202210222451.4

    申请日:2022-03-07

    Abstract: 本发明涉及一种优化的高精度文本分类方法及装置,所述优化的高精度文本分类方法包括以下步骤:对文本进行预处理去除干扰项,得到待分类文本;将所述待分类文本进行低维映射得到词向量,并对所述待分类文本进行加权处理得到所述待分类文本中词语的权重值,将词向量和权重值结合得到加权词向量;对所述加权词向量进行语义特征信息提取得到高级特征信息;对所述高级特征信息进行权重分配,将词语级的所述高级特征信息连接成语句级特征信息,得到语句级特征向量;使用softmax函数对所述语句级特征向量进行文本分类,完成对文本的分类。本发明准确率、精确率、召回率以及f‑score值都有所提高;对语义关联词语有很好的处理效果。

    一种优化的高精度文本分类方法及装置

    公开(公告)号:CN114579746A

    公开(公告)日:2022-06-03

    申请号:CN202210222451.4

    申请日:2022-03-07

    Abstract: 本发明涉及一种优化的高精度文本分类方法及装置,所述优化的高精度文本分类方法包括以下步骤:对文本进行预处理去除干扰项,得到待分类文本;将所述待分类文本进行低维映射得到词向量,并对所述待分类文本进行加权处理得到所述待分类文本中词语的权重值,将词向量和权重值结合得到加权词向量;对所述加权词向量进行语义特征信息提取得到高级特征信息;对所述高级特征信息进行权重分配,将词语级的所述高级特征信息连接成语句级特征信息,得到语句级特征向量;使用softmax函数对所述语句级特征向量进行文本分类,完成对文本的分类。本发明准确率、精确率、召回率以及f‑score值都有所提高;对语义关联词语有很好的处理效果。

Patent Agency Ranking