一种基于BERT和外部知识的生成式自动文摘方法

    公开(公告)号:CN114398478A

    公开(公告)日:2022-04-26

    申请号:CN202210047258.1

    申请日:2022-01-17

    Inventor: 张璞 尘勇 谢传威

    Abstract: 本发明属于自然语言处理领域,具体涉及一种基于BERT和外部知识的生成式自动文摘方法,包括获取文档数据,并通过TextRank模块获取文档数据对应的关键词;将文档数据输入到BERT模型中进行编码,得到编码后的文档信息;通过关键词从外部知识模块检索外部知识,通过门控机制将外部知识与文档信息进行融合;将融合后的信息输入到Transformer模型进行解码,生成摘要;本发明使用BERT模型对文档数据编码捕捉更多的上下文信息和内部信息,提高编码的质量,使用关键词获取外部知识与文档信息进行融合,用Transformer模型丰富生成文摘的语义,提高生成摘要的流畅性和完整性,生成高质量的摘要。

    一种基于预训练模型和图卷积神经网络的知识问答方法

    公开(公告)号:CN114444695A

    公开(公告)日:2022-05-06

    申请号:CN202210080808.X

    申请日:2022-01-24

    Abstract: 本发明属于自然语言处理领域,具体涉及一种基于预训练模型和图卷积神经网络的知识问答方法;该方法包括:根据问题信息构建知识子图;采用PageRank算法完善知识子图;采用预训练模型对问题进行编码,得到初始问题向量;采用图卷积神经网络对知识子图进行编码,得到初始实体向量;根据初始问题向量和初始实体向量对知识子图进行更新;计算更新后的知识子图中所有关系的关系得分,根据关系得分构建知识子图关系集合;计算初始问答匹配分数;计算问题与每个候选答案的最终问答匹配分数,选择最终问答匹配分数最高的候选答案作为问题的答案;本发明能提高多跳推理知识问答的答案准确率,具有广阔的应用前景。

Patent Agency Ranking