多方向多角度句子语义相似识别方法、装置及存储介质

    公开(公告)号:CN116245111A

    公开(公告)日:2023-06-09

    申请号:CN202310120682.9

    申请日:2023-02-15

    Inventor: 蔡晓东 蒋鹏

    Abstract: 本发明提供一种多方向多角度句子语义相似识别方法、装置及存储介质,主要涉及自然语言处理技术领域,本方法包括提取语义序列,并通过语义序列分离出关键信息、意图信息、关系信息和时间线索信息,采用了提取相似性特征和区分性特征的新型注意力机制,对上述融合后的各个信息进行损失函数的叠加,作为整体训练函数,能够捕获并利用语料中的细节信息进而提升句子匹配准确率。

    一种语义相似度处理方法、装置、系统以及存储介质

    公开(公告)号:CN115329883B

    公开(公告)日:2023-05-09

    申请号:CN202211006720.X

    申请日:2022-08-22

    Inventor: 蔡晓东 蒋鹏

    Abstract: 本发明提供一种语义相似度处理方法、装置、系统以及存储介质,属于语言处理领域,方法包括:对原始句子数据集的筛选得到多个待测句子组;对待测句子组的提取关键字分析得到句子关键信息组以及意图信息组;对待测句子组、句子关键信息组以及意图信息组的隐藏层计算得到待测句子隐藏层、句子关键信息隐藏层以及意图信息隐藏层;根据待测句子隐藏层、句子关键信息隐藏层以及意图信息隐藏层的目标相似度分数评价分析得到语义相似度处理结果。本发明能够免受匹配语句长度的分歧,利用关键信息和潜在意图判断句子语义相似,以及利用最优化中的单纯形法保证了最优化句子匹配,提高了语义相似度结果的准确率,使得匹配的结果更加理想。

    一种单选择门与类间度量的细粒度语义相似识别的方法

    公开(公告)号:CN110826338B

    公开(公告)日:2022-06-17

    申请号:CN201911032484.7

    申请日:2019-10-28

    Inventor: 蔡晓东 蒋鹏

    Abstract: 本发明公开了一种单选择门与类间度量的细粒度语义相似识别的方法,涉及自然语言处理技术领域,技术方案为,包括搭建单选择门与类间度量的细粒度语义相似识别网络,通过对语句对进行编码得到上下文向量,再有单选择门对上下文向量进行核心信息挑选,将挑选的语句对核心信息输入匹配层若进行核心内容的匹配,再将输出的向量经融合层变为一个固定长度的向量,通过函数得到语句对的相似度得分,同时计算输出语句对之间的类间损失,将原损失和类间损失进行加权融合,使得学习的特征类间间距更小。本发明的有益效果是:本方案对经LSTM网络向量化的句子对进行核心特征提取,可以除去具有相关性的冗余特征,学习到细粒度级别的区分性特征。

    一种单选择门与类间度量的细粒度语义相似识别的方法

    公开(公告)号:CN110826338A

    公开(公告)日:2020-02-21

    申请号:CN201911032484.7

    申请日:2019-10-28

    Inventor: 蔡晓东 蒋鹏

    Abstract: 本发明公开了一种单选择门与类间度量的细粒度语义相似识别的方法,涉及自然语言处理技术领域,技术方案为,包括搭建单选择门与类间度量的细粒度语义相似识别网络,通过对语句对进行编码得到上下文向量,再有单选择门对上下文向量进行核心信息挑选,将挑选的语句对核心信息输入匹配层若进行核心内容的匹配,再将输出的向量经融合层变为一个固定长度的向量,通过函数得到语句对的相似度得分,同时计算输出语句对之间的类间损失,将原损失和类间损失进行加权融合,使得学习的特征类间间距更小。本发明的有益效果是:本方案对经LSTM网络向量化的句子对进行核心特征提取,可以除去具有相关性的冗余特征,学习到细粒度级别的区分性特征。

    一种语义关系匹配模型训练方法、系统、设备及介质

    公开(公告)号:CN117648996A

    公开(公告)日:2024-03-05

    申请号:CN202311720923.X

    申请日:2023-12-14

    Inventor: 蒋鹏 蔡晓东

    Abstract: 本发明涉及一种语义关系匹配模型训练方法、系统、设备及介质,方法包括:获取多对语句作为训练集,每个语句包括句子主旨和事实细节信息;将训练集输入预训练语义模型中,利用每对语句和对应的一对句子主旨、一对事实细节信息调整预训练语义模型中的网络参数,直到每对语句和对应的一对句子主旨、一对事实细节信息三者对应的总损失值均小于设定值。解决了现有的独立的one‑hot向量无法揭示两个语句之间的关系的丰富语义信息和指导性,从而导致信息损失,使得两个语句的匹配概率不准确的问题。

    一种解决句子匹配中混淆事实信息的处理方法及装置

    公开(公告)号:CN117272978A

    公开(公告)日:2023-12-22

    申请号:CN202311243930.5

    申请日:2023-09-25

    Inventor: 蒋鹏 蔡晓东

    Abstract: 本发明提供一种解决句子匹配中混淆事实信息的处理方法及装置,方法为:将句子匹配文本的证据序列数据输入GPT4预训练语言模型中,得到上下文嵌入,并根据所述上下文嵌入得到所述证据序列数据的隐藏层表示;基于原始GCN图神经网络和所述证据序列数据的隐藏层表示构建GCN图神经网络,构建扰动矩阵,将其引入到GCN图神经网络中,得到扰动GCN图神经网络,可减轻噪声证据的影响,并通过设置的诊断属性对扰动GCN图神经网络的提取证据子图过程的规范进行验证,以提高没有任何明确注释解释的质量,并通过总目标函数进行模型优化,最终得到了优化GCN图神经网络,解决了句子匹配中混淆事实信息的问题。

    一种段落的语义信息处理方法、装置及存储介质

    公开(公告)号:CN114881040B

    公开(公告)日:2022-12-06

    申请号:CN202210517950.6

    申请日:2022-05-12

    Inventor: 蔡晓东 蒋鹏

    Abstract: 本发明涉及一种段落的语义信息处理方法、装置及存储介质,属于语义信息处理技术领域;方法包括:导入原始段落、语义逻辑切割模型和语义理解及表达模型;将原始段落输入语义逻辑切割模型中进行逻辑切割,得到原始段落的逻辑切割跨度信息;将原始段落的逻辑切割跨度信息输入语义理解及表达模型中进行语义处理,得到原始段落的逻辑切割跨度信息的语义信息;将逻辑切割跨度信息的语义信息添加到原始段落中,得到完整段落;根据语义逻辑切割模型和语义理解及表达模型对完整段落进行更新迭代处理,得到最终的语义信息。本发明能够得到准确而全面的段落语义信息,且通过关注段落上下文的逻辑界线来提高段落语义理解和表达的准确性。

Patent Agency Ranking