一种基于主题模型的文档标注方法

    公开(公告)号:CN106407169B

    公开(公告)日:2019-01-08

    申请号:CN201610812364.9

    申请日:2016-09-09

    Abstract: 本发明的目的在于实现一种基于主题模型的标注文档的方法,能够快速地为文章标注标签,人们可以通过这些标签准确了解文章的主题以及类别。本发明为文章标注标签的过程分为四个阶段:1)选取训练集的文章,并分为若干类;2)对训练集中的每一类文档提取主题、标注标签;3)构造整个训练集的向量空间;4)对测试集的每篇文章进行打标签处理,从而实现为文章标注标签的功能。本发明具有高效性和准确性,可以减少用户的信息负担,并且在需求数据提取、特定主题文章搜索、广告针对投放等方面具有很好的应用价值。

    一种基于主题模型的文档标注方法

    公开(公告)号:CN106407169A

    公开(公告)日:2017-02-15

    申请号:CN201610812364.9

    申请日:2016-09-09

    Abstract: 本发明的目的在于实现一种基于主题模型的标注文档的方法,能够快速地为文章标注标签,人们可以通过这些标签准确了解文章的主题以及类别。本发明为文章标注标签的过程分为四个阶段:1)选取训练集的文章,并分为若干类;2)对训练集中的每一类文档提取主题、标注标签;3)构造整个训练集的向量空间;4)对测试集的每篇文章进行打标签处理,从而实现为文章标注标签的功能。本发明具有高效性和准确性,可以减少用户的信息负担,并且在需求数据提取、特定主题文章搜索、广告针对投放等方面具有很好的应用价值。

Patent Agency Ranking