发明授权
- 专利标题: 基于语义的短文本相似度计算方法
-
申请号: CN201610817910.8申请日: 2016-09-12
-
公开(公告)号: CN106372061B公开(公告)日: 2020-11-24
- 发明人: 费高雷 , 胡馨月 , 胡光岷
- 申请人: 电子科技大学
- 申请人地址: 四川省成都市高新区(西区)西源大道2006号
- 专利权人: 电子科技大学
- 当前专利权人: 电子科技大学
- 当前专利权人地址: 四川省成都市高新区(西区)西源大道2006号
- 代理机构: 成都虹盛汇泉专利代理有限公司
- 代理商 王伟
- 主分类号: G06F40/30
- IPC分类号: G06F40/30 ; G06F40/194 ; G06F16/35
摘要:
本发明公开了一种基于语义的短文本相似度计算方法。其包括语料库数据预处理并建立词语Embedding,构建词语语义树,计算短文本中词语之间的语义相似度,计算短文本之间的语义相似度。本发明以深度学习的词语Embedding为基础,结合分层聚类方法创建词语语义树,计算短文本中词语之间的相似度,并且在此基础上结合短文本的多种特征,计算短文本之间的语义相似度,有效解决了现有技术中词语语义树不能刻画新鲜词语与已知词语语义关系的缺点。
公开/授权文献
- CN106372061A 基于语义的短文本相似度计算方法 公开/授权日:2017-02-01