-
公开(公告)号:CN118982075B
公开(公告)日:2025-03-21
申请号:CN202411470800.X
申请日:2024-10-21
Applicant: 之江实验室
Abstract: 本说明书提供了一种基于知识图谱的增强大模型推理的方法、装置及设备,通过根据确定的输入大模型的输入文本中的输入实体,以及预测的该输入实体与问题答案之间的目标关系,从预设的知识图谱库中,确定匹配的匹配节点以及目标路径。然后,根据匹配节点以及目标路径确定提示路径,以根据提示路径构建子图,确定用于描述匹配节点的提示文本,并输入大模型。在为大模型补充了有效知识的同时,避免了由于输入的文本较多而超出大模型的窗口限制,也减少了输入大模型的噪声,提高了大模型推理答案的准确率,减小了“幻觉”的出现。
-
公开(公告)号:CN118966203B
公开(公告)日:2025-02-11
申请号:CN202411456385.2
申请日:2024-10-18
Applicant: 之江实验室
IPC: G06F40/279 , G06F40/216 , G06N5/022
Abstract: 本发明公开了一种大模型增强的半开放知识抽取方法和系统,能够精准地筛选高质量且与关注问题相关的语料,并实现高效且准确的知识抽取。包括:首先,基于给定的种子实体检索包含这些种子实体的相关语料;接着,基于知识抽取的目的和关注的问题,计算检索到的语料和关注点之间的关联程度,筛选出关联度高的语料作为知识抽取的源语料;随后,利用大模型从源语料中抽取将种子实体作为头实体的三元组;再利用大模型判断抽取出来的三元组的置信度,筛选出置信度超过阈值的三元组;进一步检查所得三元组的语法、词性等,筛选出符合规范的三元组;最后,通过实体、关系标准化对齐、同义词提取融合等技术,实现知识的去重和规范化,得到最终需要的三元组。
-
公开(公告)号:CN119293193B
公开(公告)日:2025-03-21
申请号:CN202411812389.X
申请日:2024-12-10
Applicant: 之江实验室
IPC: G06F16/3329 , G06F40/186
Abstract: 本说明书公开了一种问答对生成方法、装置、存储介质及电子设备。在本说明书提供的问答对生成方法中,获取用于生成问答对的文本素材;将所述文本素材输入大语言模型,使所述大语言模型根据所述文本素材输出伪问答对;响应于接收到用户输入的真实问题,在各伪问答对中确定与所述真实问题匹配的目标伪问答对;将所述目标伪问答对嵌入所述大语言模型的提示模板,并将所述真实问题输入所述大语言模型,得到所述大语言模型输出的优化答案;将所述真实问题与所述优化答案确定为待定问答对,并对所述待定问答对进行质量评测;响应于所述待定问答对通过所述质量评测,将所述待定问答对确定为可用问答对。
-
公开(公告)号:CN118193797A
公开(公告)日:2024-06-14
申请号:CN202410618752.8
申请日:2024-05-17
Applicant: 之江实验室
IPC: G06F16/901 , G06F16/906 , G06F18/214 , G06F18/22 , G06F18/2431
Abstract: 本说明书公开了一种业务执行的方法、装置、存储介质及电子设备。其中,首先获取若干样本对象信息以及目标图数据结构,并提取若干样本对象信息的样本特征;根据样本特征,确定用于表征各样本对象信息间相似程度的邻接矩阵;根据邻接矩阵,处理样本特征,得到样本向量,以通过样本向量,对预先部署的识别模型进行训练;根据训练识别模型时所产生的梯度信息,调整邻接矩阵,获取调整后邻接矩阵,并根据调整后邻接矩阵,确定调整后样本向量;通过调整后样本向量,对待训练的图迁移学习模型进行训练,以通过训练后的图迁移学习模型,对目标图数据结构中包含的各节点进行分类,从而根据分类后图数据结构,执行业务。
-
公开(公告)号:CN118982075A
公开(公告)日:2024-11-19
申请号:CN202411470800.X
申请日:2024-10-21
Applicant: 之江实验室
Abstract: 本说明书提供了一种基于知识图谱的增强大模型推理的方法、装置及设备,通过根据确定的输入大模型的输入文本中的输入实体,以及预测的该输入实体与问题答案之间的目标关系,从预设的知识图谱库中,确定匹配的匹配节点以及目标路径。然后,根据匹配节点以及目标路径确定提示路径,以根据提示路径构建子图,确定用于描述匹配节点的提示文本,并输入大模型。在为大模型补充了有效知识的同时,避免了由于输入的文本较多而超出大模型的窗口限制,也减少了输入大模型的噪声,提高了大模型推理答案的准确率,减小了“幻觉”的出现。
-
公开(公告)号:CN118193757B
公开(公告)日:2024-07-30
申请号:CN202410618754.7
申请日:2024-05-17
Applicant: 之江实验室
IPC: G06F16/36 , G06F40/284 , G06N5/022 , G06F18/25 , G06F40/30
Abstract: 本说明书公开了一种任务执行方法、装置、存储介质及电子设备,终端设备在获取至少两个知识图谱后,先确定各知识图谱中包含的每个实体对应的名称表示向量、结构表示向量以及描述表示向量,而后根据每个实体对应的各向量确定每个实体对应的综合表示向量,从而根据每个实体对应的综合表示向量确定各等价实体集合以及各等价实体关系集合,进而根据各等价实体集合以及各等价实体关系集合融合各知识图谱,根据接收到的业务指令调取融合后的知识图执行目标任务。终端设备先确定出各等价实体集合以及各等价实体关系集合,进而融合各知识图谱,提高了多个知识图谱的融合效率以及融合效果。
-
公开(公告)号:CN119047458B
公开(公告)日:2025-04-04
申请号:CN202411525964.8
申请日:2024-10-30
Applicant: 之江实验室
IPC: G06F40/205 , G06F40/253 , G06V30/148 , G06F40/154
Abstract: 本发明公开了一种面向科学领域大模型训练语料的可视化方法和系统,包括:在服务端将从对象存储服务器获取的markdown格式的科学领域大模型训练语料分段流式传输到客户端;在客户端对接收到的markdown文本中的富文本内容进行解析和渲染得到还原结果;在客户端生成markdown文本的PDF原文内容与还原结果的对比图,并在对比图上附加语料元数据、用户信息水印和语料质量评分。本发明能够高效、准确、安全地传输、解析、渲染和分享markdown格式的科学领域大模型训练语料,并将语料质量评估结果分享到内外部专家,从而帮助科学领域大模型训练提供高质量语料数据,提高科学领域大模型准确率。
-
公开(公告)号:CN119047458A
公开(公告)日:2024-11-29
申请号:CN202411525964.8
申请日:2024-10-30
Applicant: 之江实验室
IPC: G06F40/205 , G06F40/253 , G06V30/148 , G06F40/154
Abstract: 本发明公开了一种面向科学领域大模型训练语料的可视化方法和系统,包括:在服务端将从对象存储服务器获取的markdown格式的科学领域大模型训练语料分段流式传输到客户端;在客户端对接收到的markdown文本中的富文本内容进行解析和渲染得到还原结果;在客户端生成markdown文本的PDF原文内容与还原结果的对比图,并在对比图上附加语料元数据、用户信息水印和语料质量评分。本发明能够高效、准确、安全地传输、解析、渲染和分享markdown格式的科学领域大模型训练语料,并将语料质量评估结果分享到内外部专家,从而帮助科学领域大模型训练提供高质量语料数据,提高科学领域大模型准确率。
-
公开(公告)号:CN118193797B
公开(公告)日:2024-07-26
申请号:CN202410618752.8
申请日:2024-05-17
Applicant: 之江实验室
IPC: G06F16/901 , G06F16/906 , G06F18/214 , G06F18/22 , G06F18/2431
Abstract: 本说明书公开了一种业务执行的方法、装置、存储介质及电子设备。其中,首先获取若干样本对象信息以及目标图数据结构,并提取若干样本对象信息的样本特征;根据样本特征,确定用于表征各样本对象信息间相似程度的邻接矩阵;根据邻接矩阵,处理样本特征,得到样本向量,以通过样本向量,对预先部署的识别模型进行训练;根据训练识别模型时所产生的梯度信息,调整邻接矩阵,获取调整后邻接矩阵,并根据调整后邻接矩阵,确定调整后样本向量;通过调整后样本向量,对待训练的图迁移学习模型进行训练,以通过训练后的图迁移学习模型,对目标图数据结构中包含的各节点进行分类,从而根据分类后图数据结构,执行业务。
-
公开(公告)号:CN119293193A
公开(公告)日:2025-01-10
申请号:CN202411812389.X
申请日:2024-12-10
Applicant: 之江实验室
IPC: G06F16/3329 , G06F40/186
Abstract: 本说明书公开了一种问答对生成方法、装置、存储介质及电子设备。在本说明书提供的问答对生成方法中,获取用于生成问答对的文本素材;将所述文本素材输入大语言模型,使所述大语言模型根据所述文本素材输出伪问答对;响应于接收到用户输入的真实问题,在各伪问答对中确定与所述真实问题匹配的目标伪问答对;将所述目标伪问答对嵌入所述大语言模型的提示模板,并将所述真实问题输入所述大语言模型,得到所述大语言模型输出的优化答案;将所述真实问题与所述优化答案确定为待定问答对,并对所述待定问答对进行质量评测;响应于所述待定问答对通过所述质量评测,将所述待定问答对确定为可用问答对。
-
-
-
-
-
-
-
-
-