-
公开(公告)号:CN104246763B
公开(公告)日:2017-09-01
申请号:CN201380017595.5
申请日:2013-02-26
Applicant: 三菱电机株式会社
CPC classification number: G06F17/30663 , G06F17/2785
Abstract: 文本被处理以构造文本的模型。文本具有共用词汇。文本被分成文本的集合和子集。共用词汇在两个或更多个集合中的用法不同,并且两个或更多个子集的主题不同。针对文本定义概率模型。该概率模型将文本中的各单词视为具有位置和单词值的标志,并且使用该概率模型中的随机变量的分布来表示在文本中的共用词汇的用法、主题、子主题和针对各标志的单词值,其中该随机变量是离散的。对应于与单词关联的词汇用法、单词值、主题和子主题,针对模型,估计参数。
-
公开(公告)号:CN104246763A
公开(公告)日:2014-12-24
申请号:CN201380017595.5
申请日:2013-02-26
Applicant: 三菱电机株式会社
CPC classification number: G06F17/30663 , G06F17/2785
Abstract: 文本被处理以构造文本的模型。文本具有共用词汇。文本被分成文本的集合和子集。共用词汇在两个或更多个集合中的用法不同,并且两个或更多个子集的主题不同。针对文本定义概率模型。该概率模型将文本中的各单词视为具有位置和单词值的标志,并且使用该概率模型中的随机变量的分布来表示在文本中的共用词汇的用法、主题、子主题和针对各标志的单词值,其中该随机变量是离散的。对应于与单词关联的词汇用法、单词值、主题和子主题,针对模型,估计参数。
-