主题模型的生成方法及装置、主题分布的获取方法及装置

    公开(公告)号:CN104536979B

    公开(公告)日:2018-05-01

    申请号:CN201410738272.1

    申请日:2014-12-05

    Inventor: 石磊 蒋佳军

    Abstract: 本发明实施例提供了一种主题模型的生成方法及装置、主题分布的获取方法及装置。一方面,本发明实施例通过获得训练样本中词对的第一后验概率参数;从而,依据所述第一后验概率参数,获得所述训练样本中词对的主题分布的候选期望;其中,所述词对包含所述训练样本中两个不同的词条,以及依据所述训练样本中词对的主题分布的候选期望,获得主题模型的收敛度;进而,若所述主题模型的收敛度满足终止条件,将所述训练样本中词对的主题分布的候选期望作为所述主题分布的目标期望。因此,本发明实施例提供的技术方案用以解决现有技术中利用传统的主题模型获得文本的主题分布的准确性和稳定性比较低的问题。

    提取文档关键句的方法及装置

    公开(公告)号:CN105243053A

    公开(公告)日:2016-01-13

    申请号:CN201510587652.4

    申请日:2015-09-15

    Abstract: 本发明公开了一种提取文档关键句的方法及装置,其中所述方法包括:根据层级语义向量模型训练得到与文档相关的句子向量和文档向量,所述层级语义向量模型包含预先根据文档训练资料库训练得到的句子向量更新公式和文档向量更新公式;计算所述句子向量和所述文档向量之间的相关性;选取所述相关性满足预设条件的句子向量对应的句子作为所述文档的第一关键句。本发明实施例能够提取出的精确表达文档信息的关键句。

    提取文档关键句的方法及装置

    公开(公告)号:CN105243053B

    公开(公告)日:2018-02-09

    申请号:CN201510587652.4

    申请日:2015-09-15

    Abstract: 本发明公开了一种提取文档关键句的方法及装置,其中所述方法包括:根据层级语义向量模型训练得到与文档相关的句子向量和文档向量,所述层级语义向量模型包含预先根据文档训练资料库训练得到的句子向量更新公式和文档向量更新公式;计算所述句子向量和所述文档向量之间的相关性;选取所述相关性满足预设条件的句子向量对应的句子作为所述文档的第一关键句。本发明实施例能够提取出的精确表达文档信息的关键句。

    主题模型的生成方法及装置、主题分布的获取方法及装置

    公开(公告)号:CN104536979A

    公开(公告)日:2015-04-22

    申请号:CN201410738272.1

    申请日:2014-12-05

    Inventor: 石磊 蒋佳军

    CPC classification number: G06F17/30445 G06F17/30575

    Abstract: 本发明实施例提供了一种主题模型的生成方法及装置、主题分布的获取方法及装置。一方面,本发明实施例通过获得训练样本中词对的第一后验概率参数;从而,依据所述第一后验概率参数,获得所述训练样本中词对的主题分布的候选期望;其中,所述词对包含所述训练样本中两个不同的词条,以及依据所述训练样本中词对的主题分布的候选期望,获得主题模型的收敛度;进而,若所述主题模型的收敛度满足终止条件,将所述训练样本中词对的主题分布的候选期望作为所述主题分布的目标期望。因此,本发明实施例提供的技术方案用以解决现有技术中利用传统的主题模型获得文本的主题分布的准确性和稳定性比较低的问题。

Patent Agency Ranking