-
公开(公告)号:CN119150996B
公开(公告)日:2025-03-18
申请号:CN202411624995.9
申请日:2024-11-14
Applicant: 之江实验室
Abstract: 本发明公开了一种结构感知的大模型图推理方法和系统,能够将图数据转化为结构感知的序列,支持大模型的零样本推理,从而高效且准确地完成图推理任务。包括:首先,准备图数据和图推理任务,图数据包括节点、边及其特征,然后对图数据进行标准化处理,并对图数据进行结构化编码;接着,将结构化编码的图数据转化为结构感知的序列,该序列可以是代码语言或者标准的图查询语言;随后,将序列化的图数据输入到大模型中,并设计特定的输入格式和任务描述,使大模型能够理解和执行图推理任务;紧接着,从大模型的输出中解析推理的结果,转化为结构化数据或者自然语言描述,供用户或者其他系统使用;最后,对推理结果进行验证和评估,确保结果的可靠性。
-
公开(公告)号:CN118966203A
公开(公告)日:2024-11-15
申请号:CN202411456385.2
申请日:2024-10-18
Applicant: 之江实验室
IPC: G06F40/279 , G06F40/216 , G06N5/022
Abstract: 本发明公开了一种大模型增强的半开放知识抽取方法和系统,能够精准地筛选高质量且与关注问题相关的语料,并实现高效且准确的知识抽取。包括:首先,基于给定的种子实体检索包含这些种子实体的相关语料;接着,基于知识抽取的目的和关注的问题,计算检索到的语料和关注点之间的关联程度,筛选出关联度高的语料作为知识抽取的源语料;随后,利用大模型从源语料中抽取将种子实体作为头实体的三元组;再利用大模型判断抽取出来的三元组的置信度,筛选出置信度超过阈值的三元组;进一步检查所得三元组的语法、词性等,筛选出符合规范的三元组;最后,通过实体、关系标准化对齐、同义词提取融合等技术,实现知识的去重和规范化,得到最终需要的三元组。
-
公开(公告)号:CN118982075A
公开(公告)日:2024-11-19
申请号:CN202411470800.X
申请日:2024-10-21
Applicant: 之江实验室
Abstract: 本说明书提供了一种基于知识图谱的增强大模型推理的方法、装置及设备,通过根据确定的输入大模型的输入文本中的输入实体,以及预测的该输入实体与问题答案之间的目标关系,从预设的知识图谱库中,确定匹配的匹配节点以及目标路径。然后,根据匹配节点以及目标路径确定提示路径,以根据提示路径构建子图,确定用于描述匹配节点的提示文本,并输入大模型。在为大模型补充了有效知识的同时,避免了由于输入的文本较多而超出大模型的窗口限制,也减少了输入大模型的噪声,提高了大模型推理答案的准确率,减小了“幻觉”的出现。
-
公开(公告)号:CN118982075B
公开(公告)日:2025-03-21
申请号:CN202411470800.X
申请日:2024-10-21
Applicant: 之江实验室
Abstract: 本说明书提供了一种基于知识图谱的增强大模型推理的方法、装置及设备,通过根据确定的输入大模型的输入文本中的输入实体,以及预测的该输入实体与问题答案之间的目标关系,从预设的知识图谱库中,确定匹配的匹配节点以及目标路径。然后,根据匹配节点以及目标路径确定提示路径,以根据提示路径构建子图,确定用于描述匹配节点的提示文本,并输入大模型。在为大模型补充了有效知识的同时,避免了由于输入的文本较多而超出大模型的窗口限制,也减少了输入大模型的噪声,提高了大模型推理答案的准确率,减小了“幻觉”的出现。
-
公开(公告)号:CN118966203B
公开(公告)日:2025-02-11
申请号:CN202411456385.2
申请日:2024-10-18
Applicant: 之江实验室
IPC: G06F40/279 , G06F40/216 , G06N5/022
Abstract: 本发明公开了一种大模型增强的半开放知识抽取方法和系统,能够精准地筛选高质量且与关注问题相关的语料,并实现高效且准确的知识抽取。包括:首先,基于给定的种子实体检索包含这些种子实体的相关语料;接着,基于知识抽取的目的和关注的问题,计算检索到的语料和关注点之间的关联程度,筛选出关联度高的语料作为知识抽取的源语料;随后,利用大模型从源语料中抽取将种子实体作为头实体的三元组;再利用大模型判断抽取出来的三元组的置信度,筛选出置信度超过阈值的三元组;进一步检查所得三元组的语法、词性等,筛选出符合规范的三元组;最后,通过实体、关系标准化对齐、同义词提取融合等技术,实现知识的去重和规范化,得到最终需要的三元组。
-
公开(公告)号:CN116757278B
公开(公告)日:2024-01-09
申请号:CN202311053464.4
申请日:2023-08-21
Applicant: 之江实验室
Abstract: 本说明书公开了一种预测模型的训练方法、装置、存储介质及电子设备,通过对样本图中的各节点进行聚类,再基于聚类结果中与目标节点属于相同聚类簇但与目标节点不存在链接关系的各节点,以及与所述目标节点距离较近但与该目标节点之间也不存在链接关系的各节点,确定指定节点,并将该指定节点和目标节点进行组合得到负样本对,以及根据确定出的负样本对和基于样本图中原有的链接关系确定出的正样本对,对该预测模型进行训练。本方法能充分考虑并利用节点间的相似信息进行负采样,从而使得训练得到的预测模型,可针对每个节点,准确预测其他节点与该节点之间存在链接关系的可能性,提高了预测结果的准确率。
-
公开(公告)号:CN116757278A
公开(公告)日:2023-09-15
申请号:CN202311053464.4
申请日:2023-08-21
Applicant: 之江实验室
Abstract: 本说明书公开了一种预测模型的训练方法、装置、存储介质及电子设备,通过对样本图中的各节点进行聚类,再基于聚类结果中与目标节点属于相同聚类簇但与目标节点不存在链接关系的各节点,以及与所述目标节点距离较近但与该目标节点之间也不存在链接关系的各节点,确定指定节点,并将该指定节点和目标节点进行组合得到负样本对,以及根据确定出的负样本对和基于样本图中原有的链接关系确定出的正样本对,对该预测模型进行训练。本方法能充分考虑并利用节点间的相似信息进行负采样,从而使得训练得到的预测模型,可针对每个节点,准确预测其他节点与该节点之间存在链接关系的可能性,提高了预测结果的准确率。
-
公开(公告)号:CN119293218B
公开(公告)日:2025-03-07
申请号:CN202411795064.5
申请日:2024-12-09
Applicant: 之江实验室
IPC: G06F16/334 , G06F16/36 , G06F40/30 , G06F40/295 , G06N5/022 , G06N5/04 , G06N3/0455
Abstract: 本发明公开了一种知识图谱增强的大模型多跳推理方法和系统,根据需要回答的问题,从外部知识图谱中提取以实体为中心的路径知识,并整合注入到大模型的理解和推理过程中,增强了大模型在解决复杂问题中的推理能力,并减少了幻觉现象。首先,基于给定的问题提取问题中的实体;接着,从外部知识图谱中搜索以实体为起点的多跳路径知识和以实体对为起终点的限长路径知识;随后,使用编码器计算给定问题和路径知识的嵌入向量并计算它们之间的相似性,保留相似度最高的路径知识;再利用大模型聚合筛选后的路径知识,形成全局知识;最后,使用预定义的指令模板整合筛选后的路径知识和聚合得到的全局知识到提示词中,激发大模型生成基于提供知识的答案。
-
公开(公告)号:CN117009038A
公开(公告)日:2023-11-07
申请号:CN202311283918.7
申请日:2023-10-07
Applicant: 之江实验室
Abstract: 本发明公开一种基于云原生技术的图计算平台,该平台包括使用云原生架构设计的软硬件协同系统、图存储系统、图计算引擎和图开发工场系统;其中,软硬件协同系统、图存储系统、图计算引擎运行在后端,图开发工场运行在前端。软硬件协同系统提供硬件计算资源和软硬件适配环境,图存储系统包括图划分模块、分布式持久化存储模块和分布式共享内存池模块,图计算引擎包括图查询引擎、图分析引擎和图学习引擎,图开发工场系统为基于图计算引擎构建的面向图计算领域的可视化操作系统,以K8s容器化的技术部署,用于将图计算算法的整个开发过程组件化、流程化和可视化。本发明的平台架构清晰、可扩展性强、使用门槛低、计算效率高。
-
公开(公告)号:CN119293218A
公开(公告)日:2025-01-10
申请号:CN202411795064.5
申请日:2024-12-09
Applicant: 之江实验室
IPC: G06F16/334 , G06F16/36 , G06F40/30 , G06F40/295 , G06N5/022 , G06N5/04 , G06N3/0455
Abstract: 本发明公开了一种知识图谱增强的大模型多跳推理方法和系统,根据需要回答的问题,从外部知识图谱中提取以实体为中心的路径知识,并整合注入到大模型的理解和推理过程中,增强了大模型在解决复杂问题中的推理能力,并减少了幻觉现象。首先,基于给定的问题提取问题中的实体;接着,从外部知识图谱中搜索以实体为起点的多跳路径知识和以实体对为起终点的限长路径知识;随后,使用编码器计算给定问题和路径知识的嵌入向量并计算它们之间的相似性,保留相似度最高的路径知识;再利用大模型聚合筛选后的路径知识,形成全局知识;最后,使用预定义的指令模板整合筛选后的路径知识和聚合得到的全局知识到提示词中,激发大模型生成基于提供知识的答案。
-
-
-
-
-
-
-
-
-