结构化查询语句的生成方法和系统

    公开(公告)号:CN119739728A

    公开(公告)日:2025-04-01

    申请号:CN202411595541.3

    申请日:2024-11-08

    Abstract: 本说明书提供一种结构化查询语句的生成方法和系统,包括:基于结构化查询语句生成模型,将自然语言查询语句拆解为若干个自然语言查询子句,并基于结构化查询语句生成模型,将若干个自然语言查询子句生成为结构化查询语句。其中,结构化查询语句生成模型为基于第一大模型蒸馏得到的第二大模型,该第二大模型的参数比所述第一大模型少。通过将经知识蒸馏技术的小模型应用于生成方法中,使得小模型在保持较高性能的同时,参数量显著减少,从而可以提高生成效率,且减少对计算资源的占用。另外,通过将复杂的自然语言查询语句拆解为一个或多个简单的自然语言查询子句,可以更容易地理解和处理查询意图,从而提高生成的准确性和可靠性。

    一种图数据和领域知识分离的问题应答方法及装置

    公开(公告)号:CN117786177A

    公开(公告)日:2024-03-29

    申请号:CN202311873681.8

    申请日:2023-12-29

    Abstract: 本说明书实施例提供了一种图数据和领域知识分离的问题应答方法及装置。在该方法中,基于事实数据构建的知识图谱存储在图数据库中,与领域知识对应的关键词及其语义规则存储在领域规则平台中,两者相互分离。关键词指代关系或概念,知识图谱不包含该关键词指代的关系对应的边,或指代的概念对应的节点。对于第一问题,领域规则平台识别其中的实体词和对应于待查询领域知识的目标关键词,通过查询图数据库,获取知识图谱中与实体词对应的节点相关的实例子图,从多个关键词与其语义规则的对应关系中,确定与目标关键词对应的语义规则,基于该语义规则和实例子图中的图数据,确定待查询领域知识,从而作为第一问题的答案。事实数据包含隐私数据。

    基于知识图谱的任务处理方法及装置

    公开(公告)号:CN114579826B

    公开(公告)日:2022-08-12

    申请号:CN202210450881.1

    申请日:2022-04-27

    Abstract: 本说明书实施例提供了基于知识图谱的任务处理方法及装置。该方法的一具体实施方式包括:从待执行的多个子图匹配任务中提取公共子任务,该多个子图匹配任务关联于目标知识图谱;获取公共子任务对应的中间结果数据,中间结果数据根据目标知识图谱生成;根据公共子任务,改写该多个子图匹配任务,得到改写后的多个第一任务;基于中间结果数据,执行该多个第一任务。

    知识图谱子图匹配的动态控制方法和系统

    公开(公告)号:CN114461734B

    公开(公告)日:2022-07-12

    申请号:CN202210376431.2

    申请日:2022-04-12

    Abstract: 本公开提供了一种知识图谱子图匹配的动态控制方法,包括:加载知识图谱数据;获取针对知识图谱子图匹配的预期执行时长以及预定义裁剪策略;按深度执行子图匹配,其中在执行中获取并动态更新每个深度的消息处理速度和消息扩展量;基于所获取并更新的每个深度的消息处理速度和消息扩展量,估算知识图谱子图匹配的执行时长;以及当所估算的执行时长超过预期执行时长时,根据预定义裁剪策略裁剪该知识图谱子图,以缩短知识图谱子图匹配的执行时长。

    一种基于知识视图的知识图谱数据处理方法和系统

    公开(公告)号:CN113849579B

    公开(公告)日:2024-06-28

    申请号:CN202111141811.X

    申请日:2021-09-27

    Abstract: 本说明书实施例公开了一种基于知识视图的知识图谱数据处理方法和系统。其中,该方法包括:获取知识视图的定义数据,所述知识视图的定义数据至少用于从基础知识图谱中指定目标知识以及用于指定对至少部分目标知识的加工方法;基于所述加工方法对所述至少部分目标知识进行知识加工,获得图谱增量数据并进行增量存储,进而获得知识视图元数据,以便数据使用方基于其获取知识视图并加以使用;其中,所述知识视图包括目标知识以及所述图谱增量数据,所述知识视图元数据包括目标知识的存储位置信息,以及所述图谱增量数据的存储位置信息。

    识别模型训练方法及装置
    6.
    发明公开

    公开(公告)号:CN117744735A

    公开(公告)日:2024-03-22

    申请号:CN202311870184.2

    申请日:2023-12-29

    Inventor: 刘志臻

    Abstract: 一种识别模型训练方法及装置,可应用于AI技术领域。所述方法包括:获取具有预定类别标签的目标对象在所述关系图中对应节点的目标I D,并确定所述目标I D在所述N个I D区段中所属的第一I D区段;在所述第一I D区段对应的数据集合中,查询以所述目标对象为中心节点的第一子图数据;将基于所述第一子图数据形成的样本子图输入至基于图神经网络构建的识别模型,以训练所述识别模型识别所述预定类别对象的能力。所述方法可以在保障识别模型训练效率的同时,节省内存资源。

    一种图数据查询方法和系统

    公开(公告)号:CN114564571B

    公开(公告)日:2022-07-29

    申请号:CN202210418826.4

    申请日:2022-04-21

    Abstract: 本说明书实施例公开了一种图数据查询方法和系统。其中,所述图数据被拆分为多个子图数据并分布式存储在多个计算单元处,该方法包括:获取用户输入的查询条件;其中,所述查询条件用于描述查询图、以及指定查询图中需要返回实例数据的目标节点和/或目标边;基于所述查询条件,确定查询数据结构;所述查询数据结构包括查询图中节点和边分别对应的节点字段和边字段;将所述查询数据结构在一个以上计算单元中流转,以便计算单元补充字段对应的实例数据或实例数据的代位标识,进而使得查询数据结构中包含所述目标节点和/或目标边的相关实例数据;其中,实例数据的代位标识的数据量小于实例数据。

    一种知识图谱处理方法和系统

    公开(公告)号:CN113886605B

    公开(公告)日:2025-01-24

    申请号:CN202111243147.X

    申请日:2021-10-25

    Abstract: 本说明书实施例提供了一种知识图谱处理方法和系统,方法包括:基于目标业务域涉及的一个或多个实体类型从共享知识图谱中选取若干节点及其边,得到目标子图谱;所述共享知识图谱基于一个或多个业务域的知识图谱融合得到;对所述目标子图谱进行处理,以提取一种或多种图谱特征,所述图谱特征包括以下中的部分或全部:节点表征向量、边表征向量、图结构特征、图谱中文本信息的语义特征、图谱规则特征;将所述图谱特征提供给目标业务域的目标数据处理任务;其中,所述图谱特征用于与任务定制化特征一同作为所述目标数据处理任务的输入特征,以实现目标数据处理任务。

    知识查询推理方法及装置、知识库系统

    公开(公告)号:CN118940845A

    公开(公告)日:2024-11-12

    申请号:CN202411419984.7

    申请日:2024-10-11

    Abstract: 本说明书提供一种知识查询推理方法及装置、知识库系统,方法包括根据用户查询短语对知识图谱上的关联节点进行检索,并在根据关联节点未检索到查询结果的情况下,从知识图谱中获取与关联节点对应的文本信息,文本信息用于描述节点对应的事实知识,根据文本信息以及用户查询短语调用大语言模型生成查询结果。通过知识图谱中结构化知识与文本知识的融合表示,可以避免知识图谱过渡结构化带来的维度灾难和难以维护问题,降低成本和图谱复杂性,文本知识可以弥补结构化知识的上下文信息缺失问题;而且知识图谱中文本知识也可以弥补大语言模型的事实知识缺失问题,实现大语言模型与知识图谱性能的双向增强。

    训练图神经网络的方法和装置
    10.
    发明公开

    公开(公告)号:CN118052264A

    公开(公告)日:2024-05-17

    申请号:CN202410190033.0

    申请日:2024-02-20

    Inventor: 刘志臻 敬斌

    Abstract: 本说明书实施例提供了一种训练图神经网络的方法和装置。该方法的一具体实施方式包括:接收用户设置的配置信息,其中,所述配置信息包括针对目标知识图谱中若干项属性分别设置的特征处理算子;所述若干项属性包括实体的属性和/或关系的属性;从所述目标知识图谱中获取子图的原始数据,其中,所述原始数据包括所述若干项属性的第一形式的属性值,所述第一形式为用户可读可理解的形式;根据所述配置信息,采用所述特征处理算子分别处理所述第一形式的属性值,得到所述若干项属性的第二形式的特征表示,所述第二形式为数值化或向量化编码的形式;根据所述子图对应的特征图数据训练目标图神经网络,所述特征图数据基于所述第二形式的特征表示形成。

Patent Agency Ranking