融合事实文本的问句分解式语义解析方法

    公开(公告)号:CN114841170B

    公开(公告)日:2024-06-18

    申请号:CN202210288047.7

    申请日:2022-03-23

    Abstract: 本发明涉及融合事实文本的问句分解式语义解析方法,属于自然语言处理技术领域。本发明包括步骤:分为分解‑抽取‑解析三个阶段,首先把复杂问题分解成简单子问题序列,然后抽取原始问题和子问题中的关键信息,最后通过整合以上信息生成结构化查询语句。同时,为了避免在分解过程中实体判断错误或主题实体缺失的情况,又将知识库中的三元组转化成用自然语言描述的事实文本信息,构造事实文本库,采用注意力机制获取更丰富的知识,旨在增强实体的表示信息,减少错误传播。本发明融合了事实文本信息,采用问句分解的方式对复杂问题进行语义解析,提升了问答模型对复杂问题的理解能力,从而解决了知识库问答技术对复杂问题的处理效果不佳的问题。

    一种基于自注意变分自编码的类案推荐方法

    公开(公告)号:CN111709231B

    公开(公告)日:2022-11-18

    申请号:CN202010366669.8

    申请日:2020-04-30

    Abstract: 本发明涉及一种基于自注意变分自编码的类案推荐方法,属于自然语言处理技术领域。本发明包括步骤:对案件文本进行分词、构建词表和隐去案件类型的预处理;获取案件文本的词频统计特征;使用自注意力机制得到案件文本的上下文特征;构建基于自注意机制的变分自编码模型,融合文本的词频统计特征和上下文特征,得到案件的融合特征向量;使用融合特征向量的期望作为案件文本的表征向量,再使用这个向量计算与其他向量的相似性从而实现类案推荐。本发明利用变分自编码融合统计特征和特征信息,挖掘文本的潜在特征,很好表征了案件文本,从而实现类案推荐。

    一种基于自注意变分自编码的类案推荐方法

    公开(公告)号:CN111709231A

    公开(公告)日:2020-09-25

    申请号:CN202010366669.8

    申请日:2020-04-30

    Abstract: 本发明涉及一种基于自注意变分自编码的类案推荐方法,属于自然语言处理技术领域。本发明包括步骤:对案件文本进行分词、构建词表和隐去案件类型的预处理;获取案件文本的词频统计特征;使用自注意力机制得到案件文本的上下文特征;构建基于自注意机制的变分自编码模型,融合文本的词频统计特征和上下文特征,得到案件的融合特征向量;使用融合特征向量的期望作为案件文本的表征向量,再使用这个向量计算与其他向量的相似性从而实现类案推荐。本发明利用变分自编码融合统计特征和特征信息,挖掘文本的潜在特征,很好表征了案件文本,从而实现类案推荐。

    基于融合高效参数迁移的老-汉神经机器翻译方法及装置

    公开(公告)号:CN119026611B

    公开(公告)日:2024-12-17

    申请号:CN202411481486.5

    申请日:2024-10-23

    Abstract: 本发明涉及融合高效参数迁移的老‑汉神经机器翻译方法及装置,属于自然语言处理技术领域。为了解决罗马化过程中出现多个字符转写为同一罗马化字符导致语义信息丢失的问题,影响泰语到老挝语的迁移效果,本发明提出了一种融合高效参数迁移的老‑汉神经机器翻译方法,包括文本数据预处理、罗马化信息融合、融合高效参数迁移的老‑汉神经机器翻译模型训练以及老‑汉神经机器翻译四个部分构成。根据这四个部分功能模块化制成融合高效参数迁移的老‑汉神经机器翻译装置,对输入的老挝语句子进行翻译,本发明有效提升了老挝语到汉语的翻译效果。

    一种基于语义感知的低资源知识图谱实体对齐方法

    公开(公告)号:CN115080761B

    公开(公告)日:2024-08-06

    申请号:CN202210639007.2

    申请日:2022-06-08

    Abstract: 本发明涉及一种基于语义感知的低资源知识图谱实体对齐方法,属于自然语言处理技术领域。本发明首先使用预训练模型初始化实体和关系特征,采用伪语句使得预训练模型可以充分利用上下文信息。然后,建立一个对偶关系子图用以挖掘知识图谱关系中的语义信息,该图使用原始知识图谱中的关系作为节点构建。最后使用GAT聚合对偶关系子图并将所得的关系特征与实体特征融合作为实体聚合中实体特征的初始向量,并计算来自两个知识图谱实体间的相似度。本发明在知识图谱实体对齐任务上取得了较好的效果。

    一种联合学习框架下基于多视角图编码的选择式阅读理解方法

    公开(公告)号:CN115906862A

    公开(公告)日:2023-04-04

    申请号:CN202211298060.7

    申请日:2022-10-22

    Abstract: 本发明涉及一种联合学习框架下基于多视角图编码的选择式阅读理解方法。本发明首先通过多视角图编码网络从多个不同视角对文档、问题和候选答案联合编码,从统计特性、相对距离和深度语义三个视角捕捉文档中句子之间以及文档句子和问句之间的关联关系,充分挖掘潜在证据信息,获得问答对感知的文档编码;然后,通过一个二分类器来判断文档中每一个句子是否为证据句以实现证据抽取模块的功能;最后构建答案预测模块,使用证据抽取模块得到的文档句子作为证据的概率对多视角图编码网络得到的文档编码进行加权以及选择性融合,在联合学习的框架下同时训练两个模块,从而实现答案预测的目标。本发明在选择式阅读理解任务上取得了较好的效果。

    一种基于语义感知的低资源知识图谱实体对齐方法

    公开(公告)号:CN115080761A

    公开(公告)日:2022-09-20

    申请号:CN202210639007.2

    申请日:2022-06-08

    Abstract: 本发明涉及一种基于语义感知的低资源知识图谱实体对齐方法,属于自然语言处理技术领域。本发明首先使用预训练模型初始化实体和关系特征,采用伪语句使得预训练模型可以充分利用上下文信息。然后,建立一个对偶关系子图用以挖掘知识图谱关系中的语义信息,该图使用原始知识图谱中的关系作为节点构建。最后使用GAT聚合对偶关系子图并将所得的关系特征与实体特征融合作为实体聚合中实体特征的初始向量,并计算来自两个知识图谱实体间的相似度。本发明在知识图谱实体对齐任务上取得了较好的效果。

    一种基于要素关联注意力机制的汉越新闻文档摘要生成方法

    公开(公告)号:CN110378409A

    公开(公告)日:2019-10-25

    申请号:CN201910635870.9

    申请日:2019-07-15

    Abstract: 本发明涉及一种基于要素关联注意力机制的汉越新闻文档摘要生成方法,属于自然语言处理技术领域。本发明首先构建汉越双语词向量,将两种语言的词向量转换到同一语义空间。然后,构建了多特征融合向量,将双语新闻要素共现程度、词频特征、句子位置和句子相关度特征等统计特征融入到双语词向量中。最后,构建了基于要素关联注意力机制的LSTM神经网络模型,计算出句子的重要性分值,依据相关性分析算法,可选取分值较高的句子删除冗余信息生成摘要。本发明在汉越双语新闻文档集上取得了较好的摘要生成效果。

    基于融合高效参数迁移的老-汉神经机器翻译方法及装置

    公开(公告)号:CN119026611A

    公开(公告)日:2024-11-26

    申请号:CN202411481486.5

    申请日:2024-10-23

    Abstract: 本发明涉及融合高效参数迁移的老‑汉神经机器翻译方法及装置,属于自然语言处理技术领域。为了解决罗马化过程中出现多个字符转写为同一罗马化字符导致语义信息丢失的问题,影响泰语到老挝语的迁移效果,本发明提出了一种融合高效参数迁移的老‑汉神经机器翻译方法,包括文本数据预处理、罗马化信息融合、融合高效参数迁移的老‑汉神经机器翻译模型训练以及老‑汉神经机器翻译四个部分构成。根据这四个部分功能模块化制成融合高效参数迁移的老‑汉神经机器翻译装置,对输入的老挝语句子进行翻译,本发明有效提升了老挝语到汉语的翻译效果。

Patent Agency Ranking