对文本进行处理以构造文本模型的方法

    公开(公告)号:CN104246763B

    公开(公告)日:2017-09-01

    申请号:CN201380017595.5

    申请日:2013-02-26

    CPC classification number: G06F17/30663 G06F17/2785

    Abstract: 文本被处理以构造文本的模型。文本具有共用词汇。文本被分成文本的集合和子集。共用词汇在两个或更多个集合中的用法不同,并且两个或更多个子集的主题不同。针对文本定义概率模型。该概率模型将文本中的各单词视为具有位置和单词值的标志,并且使用该概率模型中的随机变量的分布来表示在文本中的共用词汇的用法、主题、子主题和针对各标志的单词值,其中该随机变量是离散的。对应于与单词关联的词汇用法、单词值、主题和子主题,针对模型,估计参数。

    对文本进行处理以构造文本模型的方法

    公开(公告)号:CN104246763A

    公开(公告)日:2014-12-24

    申请号:CN201380017595.5

    申请日:2013-02-26

    CPC classification number: G06F17/30663 G06F17/2785

    Abstract: 文本被处理以构造文本的模型。文本具有共用词汇。文本被分成文本的集合和子集。共用词汇在两个或更多个集合中的用法不同,并且两个或更多个子集的主题不同。针对文本定义概率模型。该概率模型将文本中的各单词视为具有位置和单词值的标志,并且使用该概率模型中的随机变量的分布来表示在文本中的共用词汇的用法、主题、子主题和针对各标志的单词值,其中该随机变量是离散的。对应于与单词关联的词汇用法、单词值、主题和子主题,针对模型,估计参数。

Patent Agency Ranking