利用句义结构特征的句子相似度计算方法

    公开(公告)号:CN106445920A

    公开(公告)日:2017-02-22

    申请号:CN201610867254.2

    申请日:2016-09-29

    CPC classification number: G06F17/271 G06F17/2785 G06K9/6215

    Abstract: 本发明为解决社交短文本句子相似度计算的特征稀疏问题,提出利用句义结构特征的句子相似度计算方法。首先基于句义结构模型分析句子语义,并利用主题模型挖掘潜在的主题知识,根据主题-词语分布扩充句子特征,得到基于句子本身特征的句子向量,然后引入Paragraph Vector深度学习模型学习句子上下文特征,得到基于上下文信息的句子向量,最后加权由两种句子向量计算得到的句子相似度。本发明通过深度挖掘句子的语义信息和上下文信息,更加全面、准确地刻画了句子之间的内在联系,提高了相似度计算的准确率。

Patent Agency Ranking