一种句子相似度计算方法

    公开(公告)号:CN109766547A

    公开(公告)日:2019-05-17

    申请号:CN201811601236.5

    申请日:2018-12-26

    Abstract: 本发明请求保护一种句子相似度计算方法,包括以下步骤:步骤(1),获取句子相似度计算的测试集和训练集,并通过词向量模型获取各词语对应的语义向量;步骤(2),基于词语权重的句向量,分别计算测试集中某一测试句子与训练集中每个训练句子的余弦相似度;步骤(3),基于词序的句向量,分别计算上述测试句子和由步骤(2)的结果筛选出的相似度前10的句子的相似度;步骤(4),基于步骤(2)和步骤(3)得到的两种句子向量计算的句子相似度,并采用MRR(平均排序倒数)参数确定方法来调节优化系数β,得出与训练集中句子相似度最大的句子。由于本发明考虑了影响句子相似度的词语权重和词序因素来计算,大大提高了句子相似度计算的精准度。

    一种基于实体链接的问答知识图谱构建方法及存储介质

    公开(公告)号:CN111767368B

    公开(公告)日:2022-08-23

    申请号:CN202010462498.9

    申请日:2020-05-27

    Abstract: 本发明请求保护一种基于实体链接的构建问答知识图谱的方法及存储介质,该方法包括以下步骤:步骤1)爬取相关业务咨询问句语料以及规范政策文本;步骤2)对预处理过后的问句语料以及规范政策文本进行结构信息抽取;步骤3)筛选得到实体候选集,筛选得到实体标准名候选集,将候选实体集中的实体与候选实体标准名进行相似度计算;步骤4)分别融合咨询语料与规范政策文本中事件的实体,链接至规范政策文本中标准事件的实体;步骤5)按照知识图谱所需结构抽取相似度在阈值范围内的规范政策文本实体及属性,构建问答知识图谱。本发明可以保证在问答系统中答案回复的准确性和高效性。

    一种句子相似度计算方法

    公开(公告)号:CN109766547B

    公开(公告)日:2022-10-18

    申请号:CN201811601236.5

    申请日:2018-12-26

    Abstract: 本发明请求保护一种句子相似度计算方法,包括以下步骤:步骤(1),获取句子相似度计算的测试集和训练集,并通过词向量模型获取各词语对应的语义向量;步骤(2),基于词语权重的句向量,分别计算测试集中某一测试句子与训练集中每个训练句子的余弦相似度;步骤(3),基于词序的句向量,分别计算上述测试句子和由步骤(2)的结果筛选出的相似度前10的句子的相似度;步骤(4),基于步骤(2)和步骤(3)得到的两种句子向量计算的句子相似度,并采用MRR(平均排序倒数)参数确定方法来调节优化系数β,得出与训练集中句子相似度最大的句子。由于本发明考虑了影响句子相似度的词语权重和词序因素来计算,大大提高了句子相似度计算的精准度。

    一种基于实体链接的问答知识图谱构建方法及存储介质

    公开(公告)号:CN111767368A

    公开(公告)日:2020-10-13

    申请号:CN202010462498.9

    申请日:2020-05-27

    Abstract: 本发明请求保护一种基于实体链接的构建问答知识图谱的方法及存储介质,该方法包括以下步骤:步骤1)爬取相关业务咨询问句语料以及规范政策文本;步骤2)对预处理过后的问句语料以及规范政策文本进行结构信息抽取;步骤3)筛选得到实体候选集,筛选得到实体标准名候选集,将候选实体集中的实体与候选实体标准名进行相似度计算;步骤4)分别融合咨询语料与规范政策文本中事件的实体,链接至规范政策文本中标准事件的实体;步骤5)按照知识图谱所需结构抽取相似度在阈值范围内的规范政策文本实体及属性,构建问答知识图谱。本发明可以保证在问答系统中答案回复的准确性和高效性。

    一种混合多特征的句子相似度计算方法、存储介质及系统

    公开(公告)号:CN110705612A

    公开(公告)日:2020-01-17

    申请号:CN201910882386.6

    申请日:2019-09-18

    Abstract: 本发明请求保护一种混合多特征的句子相似度计算方法、存储介质及系统,包括以下步骤:获取句子相似度计算的测试集和训练集,并通过词向量模型获取各词语对应的词向量;计算机基于平滑逆频率算法,由词向量利用加权和去除非信息噪音,来计算句子词向量相似度;基于“词语依存三元组”结构,分别计算上述测试句子和由筛选出的相似度前10的句子依存句法的相似度;基于得到的两种句子向量计算的句子混合相似度,并采用P@N和MRR(平均排序倒数)参数确定方法来调节优化系数β,得出与训练集中句子相似度最大的句子。由于本发明考虑了句子中关键词、词向量和句法结构等多方面的特点,更为精确地表达句子的深层含义,以正确判断句子内容的相似性。

Patent Agency Ranking