一种基于先验知识和知识连接的知识图谱自动构建方法

    公开(公告)号:CN118520945A

    公开(公告)日:2024-08-20

    申请号:CN202410978360.2

    申请日:2024-07-22

    摘要: 本发明公开一种基于先验知识和知识连接的知识图谱自动构建方法,属于自然语言处理领域。将构建知识图谱的相关主题信息保存为字符串,得到提示数据;根据提示数据从外部数据源检索文章段落并进行保存;分别注入标记、推理、认知、联想四个大语言模型智能体的提示模版;将注入后的提示模版、文章段落与特定任务需求输入至智能体,得到先验知识;将文章段落、先验知识以及预定义的对比提示文本输入知识连接大语言模型,得到和知识图谱主题相关的有效数据;以和知识图谱主题相关的有效数据及预定义的输入提示作为大语言模型自动代理框架的输入层,得到实体‑关系‑实体三元组,完成知识图谱构建。实现了高可靠性数据挖掘的知识图谱自动构建。

    一种基于先验知识和知识连接的知识图谱自动构建方法

    公开(公告)号:CN118520945B

    公开(公告)日:2024-09-24

    申请号:CN202410978360.2

    申请日:2024-07-22

    摘要: 本发明公开一种基于先验知识和知识连接的知识图谱自动构建方法,属于自然语言处理领域。将构建知识图谱的相关主题信息保存为字符串,得到提示数据;根据提示数据从外部数据源检索文章段落并进行保存;分别注入标记、推理、认知、联想四个大语言模型智能体的提示模版;将注入后的提示模版、文章段落与特定任务需求输入至智能体,得到先验知识;将文章段落、先验知识以及预定义的对比提示文本输入知识连接大语言模型,得到和知识图谱主题相关的有效数据;以和知识图谱主题相关的有效数据及预定义的输入提示作为大语言模型自动代理框架的输入层,得到实体‑关系‑实体三元组,完成知识图谱构建。实现了高可靠性数据挖掘的知识图谱自动构建。

    一种面向知识图谱自动构建的数据来源验证方法

    公开(公告)号:CN117609516A

    公开(公告)日:2024-02-27

    申请号:CN202311756125.2

    申请日:2023-12-20

    摘要: 本发明涉及一种面向知识图谱自动构建的数据来源验证方法,属于自然语言处理领域。首先将用户指令作为检索器的输入,从预先保存的文档数据源中检索相关信息作为上下文;其次将得到的上下文及用户指令作为提示引擎的输入,生成解释生成器、解释验证器、答案生成器三个组件的简明提示;将得到的提示指令输入解释生成器,得到解释文本;将解释文本传入解释验证器验证该解释的准确性,并得到修正后的解释文本;答案生成器利用经过修正的解释文本生成高可靠性的相关信息数据;将生成的信息数据及预提示传入大语言模型反馈代理框架,输出Json格式的知识图谱三元组数据。本发明能实现自动化地构建高可靠性的知识图谱。

    一种基于大语言模型与提示工程的领域知识图谱自动构建方法

    公开(公告)号:CN117035076A

    公开(公告)日:2023-11-10

    申请号:CN202310965763.9

    申请日:2023-08-02

    摘要: 本发明涉及一种基于大语言模型与提示工程的领域知识图谱自动构建方法,属于自然语言处理领域。首先将任务需求与维基百科文档输入到检索增强生成模型的检索器中进行编码,得到与任务需求最相关文档索引;根据得到的文档索引找到相关文档后,将其与任务需求输入到检索增强生成模型的生成器中,得到二者相结合的上下文信息,进而获取关键事件,最后大语言模型对上下文信息进行事件提取;以思维树链式提示方式将事件输入至Role‑Playing框架中,进行大语言模型自动反馈过程,生成构建领域知识图谱的文本数据;最后对反馈的文本数据进行数据清洗得到最终的领域知识图谱。本发明能够高效、准确以及自动化地构建知识图谱。

    一种基于自检式检索增强生成及指令扩张的知识图谱自动构建方法

    公开(公告)号:CN117591677A

    公开(公告)日:2024-02-23

    申请号:CN202311457917.X

    申请日:2023-11-04

    IPC分类号: G06F16/36 G06F16/28

    摘要: 本发明涉及一种基于自检式检索增强生成及指令扩张的知识图谱自动构建方法,属于自然语言处理技术领域。将原始的多源异构数据进行数据整合,得到有效提示数据;再以所述提示数据、任务需求作为自检式检索增强生成框架的输入,训练大语言模型(LLMs)使其按需自适应检索相关段落,生成相关文本数据并完成事实验证;然后经由指令扩张框架构造大语言模型输入提示;最后以所述文本数据及输入提示作为大语言模型自动代理框架的输入层,经由大语言模型多轮反馈,得到实体‑关系‑实体三元组,完成知识图谱的构建。本发明基于自检式检索增强生成和指令扩张技术,以大语言模型作为核心引擎,实现了低资源背景下,高可靠性数据挖掘的知识图谱自动构建。