基于语义的短文本相似度计算方法
摘要:
本发明公开了一种基于语义的短文本相似度计算方法。其包括语料库数据预处理并建立词语Embedding,构建词语语义树,计算短文本中词语之间的语义相似度,计算短文本之间的语义相似度。本发明以深度学习的词语Embedding为基础,结合分层聚类方法创建词语语义树,计算短文本中词语之间的相似度,并且在此基础上结合短文本的多种特征,计算短文本之间的语义相似度,有效解决了现有技术中词语语义树不能刻画新鲜词语与已知词语语义关系的缺点。
公开/授权文献
0/0