一种文本语义相似度分析方法

    公开(公告)号:CN106547739A

    公开(公告)日:2017-03-29

    申请号:CN201610955776.8

    申请日:2016-11-03

    Applicant: 同济大学

    CPC classification number: G06F17/2785

    Abstract: 一种文本语义相似度分析方法。本发明涉及文本分析领域,特别涉及到一种基于语义特征的文本相似度分析方法。本发明的技术方案是利用文本内部词汇内在的语义联系进行计算,以达到更加准确有效地分析文本之间的相似程度。该方法通过奇异值分解浅层分析文本之间以及词项之间的关联关系,借助贝叶斯网络构建词项‐主题集,用互信息以及上下文计算词项之间的语义相似度,最后通过图结构计算文本的相似度。本发明能够更加准确有效地度量和识别文本之间的语义关系。

    一种文本语义相似度分析方法

    公开(公告)号:CN106547739B

    公开(公告)日:2019-04-02

    申请号:CN201610955776.8

    申请日:2016-11-03

    Applicant: 同济大学

    Abstract: 一种文本语义相似度分析方法。本发明涉及文本分析领域,特别涉及到一种基于语义特征的文本相似度分析方法。本发明的技术方案是利用文本内部词汇内在的语义联系进行计算,以达到更加准确有效地分析文本之间的相似程度。该方法通过奇异值分解浅层分析文本之间以及词项之间的关联关系,借助贝叶斯网络构建词项‐主题集,用互信息以及上下文计算词项之间的语义相似度,最后通过图结构计算文本的相似度。本发明能够更加准确有效地度量和识别文本之间的语义关系。

Patent Agency Ranking