-
公开(公告)号:CN118966203A
公开(公告)日:2024-11-15
申请号:CN202411456385.2
申请日:2024-10-18
Applicant: 之江实验室
IPC: G06F40/279 , G06F40/216 , G06N5/022
Abstract: 本发明公开了一种大模型增强的半开放知识抽取方法和系统,能够精准地筛选高质量且与关注问题相关的语料,并实现高效且准确的知识抽取。包括:首先,基于给定的种子实体检索包含这些种子实体的相关语料;接着,基于知识抽取的目的和关注的问题,计算检索到的语料和关注点之间的关联程度,筛选出关联度高的语料作为知识抽取的源语料;随后,利用大模型从源语料中抽取将种子实体作为头实体的三元组;再利用大模型判断抽取出来的三元组的置信度,筛选出置信度超过阈值的三元组;进一步检查所得三元组的语法、词性等,筛选出符合规范的三元组;最后,通过实体、关系标准化对齐、同义词提取融合等技术,实现知识的去重和规范化,得到最终需要的三元组。
-
公开(公告)号:CN118193757A
公开(公告)日:2024-06-14
申请号:CN202410618754.7
申请日:2024-05-17
Applicant: 之江实验室
IPC: G06F16/36 , G06F40/284 , G06N5/022 , G06F18/25 , G06F40/30
Abstract: 本说明书公开了一种任务执行方法、装置、存储介质及电子设备,终端设备在获取至少两个知识图谱后,先确定各知识图谱中包含的每个实体对应的名称表示向量、结构表示向量以及描述表示向量,而后根据每个实体对应的各向量确定每个实体对应的综合表示向量,从而根据每个实体对应的综合表示向量确定各等价实体集合以及各等价实体关系集合,进而根据各等价实体集合以及各等价实体关系集合融合各知识图谱,根据接收到的业务指令调取融合后的知识图执行目标任务。终端设备先确定出各等价实体集合以及各等价实体关系集合,进而融合各知识图谱,提高了多个知识图谱的融合效率以及融合效果。
-
公开(公告)号:CN116434976A
公开(公告)日:2023-07-14
申请号:CN202211713801.3
申请日:2022-12-29
Applicant: 之江实验室
Abstract: 一种融合多源知识图谱的药物重定位方法,包括:步骤1:采集多语种、多源生物医药数据,构建多源生物医药知识图谱;步骤2:基于多语种预训练模型获取实体初始表征向量,通过实体对齐构建不同知识图谱之间的对齐锚链;步骤3:利用关系感知图注意力网络聚合各知识图谱内部的信息,基于注意力机制聚合对齐实体以更新最完备知识图谱的实体表示向量;步骤4:将最完备知识图谱所得实体表示向量输入多层感知机分类模型,对多层感知机分类模型、关系感知图注意力网络和注意力机制及实体和关系表示向量进行训练;步骤5:对训练好的多层感知机分类模型输入给定药物‑疾病实体对,得到药物重定位预测。本发明还包括一种融合多源知识图谱的药物重定位系统。
-
-