-
公开(公告)号:CN106547739A
公开(公告)日:2017-03-29
申请号:CN201610955776.8
申请日:2016-11-03
Applicant: 同济大学
IPC: G06F17/27
CPC classification number: G06F17/2785
Abstract: 一种文本语义相似度分析方法。本发明涉及文本分析领域,特别涉及到一种基于语义特征的文本相似度分析方法。本发明的技术方案是利用文本内部词汇内在的语义联系进行计算,以达到更加准确有效地分析文本之间的相似程度。该方法通过奇异值分解浅层分析文本之间以及词项之间的关联关系,借助贝叶斯网络构建词项‐主题集,用互信息以及上下文计算词项之间的语义相似度,最后通过图结构计算文本的相似度。本发明能够更加准确有效地度量和识别文本之间的语义关系。
-
公开(公告)号:CN106547739B
公开(公告)日:2019-04-02
申请号:CN201610955776.8
申请日:2016-11-03
Applicant: 同济大学
IPC: G06F17/27
Abstract: 一种文本语义相似度分析方法。本发明涉及文本分析领域,特别涉及到一种基于语义特征的文本相似度分析方法。本发明的技术方案是利用文本内部词汇内在的语义联系进行计算,以达到更加准确有效地分析文本之间的相似程度。该方法通过奇异值分解浅层分析文本之间以及词项之间的关联关系,借助贝叶斯网络构建词项‐主题集,用互信息以及上下文计算词项之间的语义相似度,最后通过图结构计算文本的相似度。本发明能够更加准确有效地度量和识别文本之间的语义关系。
-