一种用于图谱链接预测的注意力方法及注意力模块

    公开(公告)号:CN117112804A

    公开(公告)日:2023-11-24

    申请号:CN202311079393.5

    申请日:2023-08-24

    Abstract: 本说明书实施例提供一种用于图谱链接预测的注意力方法及注意力模块,技术要点包括:获取第一节点的节点向量表示以及第二节点的节点向量表示;使用查询矩阵和键矩阵对第一节点的节点向量表示以及第二节点的节点向量表示进行处理,得到节点查询表示和节点键表示;基于所述节点查询表示和所述节点键表示获取节点注意力信息;获取第一节点和第二节点间的一个或多个结构特征中每一个的结构查询表示和结构键表示;对于所述一个或多个结构特征中的每一个:基于所述节点查询表示、所述节点键表示、结构查询表示和结构键表示得到相应的结构注意力分布信息;基于所述节点注意力信息和各结构特征对应的结构注意力分布信息,确定综合注意力分布信息。

    一种利用知识图谱生成文本语料的方法及装置

    公开(公告)号:CN116628229B

    公开(公告)日:2023-11-10

    申请号:CN202310906808.5

    申请日:2023-07-21

    Abstract: 本说明书实施例提供了一种利用知识图谱生成文本语料的方法及装置。知识图谱的图谱元素包含代表实体的节点以及体现节点之间关系的连接边。利用知识图谱能够将隐私数据组织成结构化数据。在该方法中,读取知识图谱中子图的图数据和本体信息,图数据包括子图中的图谱元素形成的若干三元组,本体信息至少包括子图中各图谱元素的类型。接着,基于预先构建的若干句子模板、上述图数据以及本体信息,生成若干句子,归入生成句子集;其中,若干句子模板中的至少一个句子模板基于本体信息构建;基于生成句子集,确定子图对应的文本语料,该文本语料用于语言模型训练。

    对用户风险的评估系统进行训练的方法及装置

    公开(公告)号:CN116883151A

    公开(公告)日:2023-10-13

    申请号:CN202310876766.5

    申请日:2023-07-17

    Abstract: 本说明书实施例提供一种对用户风险的评估系统进行训练的方法及装置,该评估系统包括知识图谱嵌入模型和用户风险预测模型。该训练方法包括:先获取预先建立的知识图谱,其中包括对应多个实体的多个节点,多个实体包括多个样本用户。接着,将各个节点分别作为中心节点执行目标处理:从知识图谱中确定与中心节点形成三角形连接的若干对邻居节点;确定中心节点的三角结构特征,其与各对邻居节点自身涉及的邻居节点数量以及中心节点的度负相关。然后,基于各个节点的三角结构特征,利用知识图谱嵌入模型对知识图谱进行嵌入处理,得到各个样本用户对应的用户嵌入向量。之后,基于用户嵌入向量和对应的风险标签,训练风险预测模型。

    医疗知识图谱查询中对多个查询结果的排序方法和装置

    公开(公告)号:CN118132681B

    公开(公告)日:2024-09-13

    申请号:CN202410547438.5

    申请日:2024-04-30

    Abstract: 本说明书实施例提供一种医疗知识图谱查询中对多个查询结果的排序方法和装置。方法包括:根据查询请求从医疗知识图谱中提取目标子图;其中,目标子图包括多个类别的输入节点和多个结果节点,输入节点对应于查询请求中携带的输入医疗实体,结果节点对应于医疗相关查询结果;确定各个类别的反映其通用贡献的第一指标分数,第一指标分数与对应类别中各输入节点在医疗知识图谱中关联的结果节点数目负相关;针对任意的目标结果节点,根据各个类别的输入节点中与该目标结果节点的关联节点数目,确定各个类别的反映其对该目标结果节点贡献度的第二指标分数;根据各个类别的第一指标分数和第二指标分数,确定目标结果节点的排序分数。

    针对图数据的处理方法和装置
    15.
    发明公开

    公开(公告)号:CN117435941A

    公开(公告)日:2024-01-23

    申请号:CN202311310674.7

    申请日:2023-10-08

    Inventor: 胡彬 赵登 何建杉

    Abstract: 本说明书实施例提供一种针对图数据的处理方法和装置,方法包括:从定义第一类别的第一规则数据中读取至少一个目标节点的标识数据;根据所述标识数据,从知识图谱的全图数据中提取子图数据;根据所述子图数据中任一原始节点到所述目标节点的距离,确定该原始节点的距离编码;至少根据所述距离编码,对所述子图数据中原始节点的节点数据进行合并处理,得到泛化图数据;所述泛化图数据的数据量小于所述子图数据;将所述泛化图数据与所述第一类别的指示数据对应存储。能够减小图数据中包含的数据量,并且不影响后续的匹配结果。

    基于知识图谱判定业务实体关联性的方法及装置

    公开(公告)号:CN116821367A

    公开(公告)日:2023-09-29

    申请号:CN202310780964.1

    申请日:2023-06-28

    Inventor: 赵登 何建杉

    Abstract: 本说明书实施例提供一种基于知识图谱判定业务实体关联性的方法及装置,在基于知识图谱判定业务实体关联性过程中,根据节点的度对节点信息进行分流,使得头节点的信息经共同邻居节点作为中间节点分流后再汇聚到尾节点。这一技术构思使得从头节点发出的信息取决于头节点的度,并且可以使得对结点的信息分流符合信息守恒。如此,可以很好地满足非对称连接结构的业务处理需求。

    一种利用知识图谱生成文本语料的方法及装置

    公开(公告)号:CN116628229A

    公开(公告)日:2023-08-22

    申请号:CN202310906808.5

    申请日:2023-07-21

    Abstract: 本说明书实施例提供了一种利用知识图谱生成文本语料的方法及装置。知识图谱的图谱元素包含代表实体的节点以及体现节点之间关系的连接边。利用知识图谱能够将隐私数据组织成结构化数据。在该方法中,读取知识图谱中子图的图数据和本体信息,图数据包括子图中的图谱元素形成的若干三元组,本体信息至少包括子图中各图谱元素的类型。接着,基于预先构建的若干句子模板、上述图数据以及本体信息,生成若干句子,归入生成句子集;其中,若干句子模板中的至少一个句子模板基于本体信息构建;基于生成句子集,确定子图对应的文本语料,该文本语料用于语言模型训练。

    一种知识图谱路径搜索方法和系统

    公开(公告)号:CN115080763A

    公开(公告)日:2022-09-20

    申请号:CN202210752653.X

    申请日:2022-06-29

    Abstract: 本说明书实施例提供了一种知识图谱路径搜索方法和系统,方法包括:获取选自所述知识图谱的至少一个节点对,每个所述节点对包括两个目标节点;基于所述至少一个节点对中的所述目标节点生成目标节点集合;基于所述多个三元组中的节点生成图谱节点集合;基于所述多个三元组,通过基于所述目标节点集合和所述图谱节点集合的笛卡尔积运算,得到相关于所述目标节点集合的至少一个N跳子图;基于所述至少一个N跳子图中的子图路径,得到所述至少一个节点对的所述两个目标节点之间K跳以内的路径;其中K≥1,1≤N≤K。

    一种知识图谱处理方法和系统

    公开(公告)号:CN113886605A

    公开(公告)日:2022-01-04

    申请号:CN202111243147.X

    申请日:2021-10-25

    Abstract: 本说明书实施例提供了一种知识图谱处理方法和系统,方法包括:基于目标业务域涉及的一个或多个实体类型从共享知识图谱中选取若干节点及其边,得到目标子图谱;所述共享知识图谱基于一个或多个业务域的知识图谱融合得到;对所述目标子图谱进行处理,以提取一种或多种图谱特征,所述图谱特征包括以下中的部分或全部:节点表征向量、边表征向量、图结构特征、图谱中文本信息的语义特征、图谱规则特征;将所述图谱特征提供给目标业务域的目标数据处理任务;其中,所述图谱特征用于与任务定制化特征一同作为所述目标数据处理任务的输入特征,以实现目标数据处理任务。

    基于文本语料生成医疗知识图谱的方法及装置

    公开(公告)号:CN118152590A

    公开(公告)日:2024-06-07

    申请号:CN202410564986.9

    申请日:2024-05-08

    Abstract: 本说明书实施例提供一种基于文本语料生成医疗知识图谱的方法及装置,在基于文本语料构建知识图谱时,可以将知识图谱的数据获取过程分为开放式抽取和对齐两个阶段。具体而言,先由大模型从原始文本语料中开放式抽取实体词及相应的实体类型,还根据所抽取的实体词和实体类型提取相应连接关系。之后,再按照预先定义的实体模式和连接模式进行实体和关系的对齐,并根据对齐结果构建知识图谱。如此,可以提高知识图谱构建的全面性和有效性。

Patent Agency Ranking