-
公开(公告)号:CN106445920A
公开(公告)日:2017-02-22
申请号:CN201610867254.2
申请日:2016-09-29
Applicant: 北京理工大学
CPC classification number: G06F17/271 , G06F17/2785 , G06K9/6215
Abstract: 本发明为解决社交短文本句子相似度计算的特征稀疏问题,提出利用句义结构特征的句子相似度计算方法。首先基于句义结构模型分析句子语义,并利用主题模型挖掘潜在的主题知识,根据主题-词语分布扩充句子特征,得到基于句子本身特征的句子向量,然后引入Paragraph Vector深度学习模型学习句子上下文特征,得到基于上下文信息的句子向量,最后加权由两种句子向量计算得到的句子相似度。本发明通过深度挖掘句子的语义信息和上下文信息,更加全面、准确地刻画了句子之间的内在联系,提高了相似度计算的准确率。