-
公开(公告)号:CN114385833B
公开(公告)日:2023-05-12
申请号:CN202210290077.1
申请日:2022-03-23
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 桂正科
Abstract: 本说明书实施例提供一种更新知识图谱的方法及装置,在为当前业务提供基于知识图谱的数据支持过程中,采用在线、离线相结合的方式更新知识图谱。首先,利用全量业务数据离线构建知识图谱,并进行全量的实体链指、实体归一,以初始化知识图谱。之后,设置增量更新条件进行多轮增量更新。在一轮增量更新期间,一方面,基于实时产生的业务数据进行实时链指提供在线的知识图谱更新,另一方面,在预设的增量更新条件满足时,按照当前增量更新周期内新增的业务数据进行增量链指,从而提供离线的知识图谱更新,并作为下一轮次增量更新的初始知识图谱。如此,可以使得相关业务处理结果更准确有效。
-
公开(公告)号:CN115618010A
公开(公告)日:2023-01-17
申请号:CN202211174393.9
申请日:2022-09-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种融合图谱的存储和处理方法。根据该存储方法,分别从第一文件和第二文件读取第一和第二业务图谱,确定两个业务图谱的若干融合节点及其一阶邻居关系,任意融合节点是将来自第一业务图谱的一个节点和来自第二业务图谱的另一节点相融合的节点。仅将若干融合节点的节点信息,及其一阶邻居关系指示的边信息,存储至第三文件。在处理阶段,当确定任务处理请求涉及融合图谱中的目标融合节点时,从存储融合结果的第三文件中读取目标融合节点的融合节点信息;以及从存储第一业务图谱的第一文件中读取第三节点的第三节点信息,其中,第三节点是目标融合节点的一阶邻居节点;至少根据融合节点信息和第三节点信息,生成响应消息。
-
公开(公告)号:CN114331662A
公开(公告)日:2022-04-12
申请号:CN202210235325.2
申请日:2022-03-11
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种识别相同业务主体的方法及装置,用于识别多个用户标识是否对应相同业务主体,或多个用户标识中是否存在对应相同业务主体的用户标识。其中的多个用户标识至少包括第一用户标识、第二用户标识,相应实施例中,可以获取第一用户标识对应的第一轨迹张量,以及第二用户标识对应的第二轨迹张量,并检测第一轨迹张量、第二轨迹张量的相似性,然后基于对第一轨迹张量、第二轨迹张量的相似性是否满足预定条件的判断结果,识别第一用户标识、第二用户标识是否对应相同业务主体。该实施方式可以提高针对流动性的业务目标的召回率。
-
公开(公告)号:CN115952862A
公开(公告)日:2023-04-11
申请号:CN202211605089.5
申请日:2022-12-14
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 桂正科
IPC: G06N5/02
Abstract: 本说明书实施例公开了一种知识图谱数据融合方法和系统。其中,该方法包括:获取融合知识图谱的本体定义数据;所述融合知识图谱的本体定义数据包括目标实体字段、目标关系描述以及融合图谱算子;基于所述融合知识图谱的本体定义数据,分别从所述两个以上知识图谱获取所述目标实体字段以及所述目标关系描述对应的实例数据;通过所述融合图谱算子对多个实例数据进行处理,获取融合知识图谱;其中,所述融合知识图谱的至少部分实例数据具有来源标记;所述来源标记指示对应的实例数据来自的知识图谱;基于所述融合知识图谱产生的实际价值和实例数据的来源标记,确定各所述知识图谱的价值贡献。
-
公开(公告)号:CN115563136A
公开(公告)日:2023-01-03
申请号:CN202211173514.8
申请日:2022-09-26
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 桂正科
Abstract: 本说明书实施例提供一种知识图谱数据加工中数据灰度发布的方法和装置。在该方法中,响应于针对知识图谱的目标数据的加工算子从第一算子更新为第二算子,在图谱存储区中针对算子更新而设置的目标字段中存储第二数据,其中第二数据是利用第二算子对目标数据加工得到的。之后,从与目标数据相关的查询请求中获取设定比例的第一查询请求,将其设置为查询所述第二数据。一旦确定第二算子通过灰度验证,将与目标数据相关的后续查询请求均设置为查询所述第二数据。
-
公开(公告)号:CN114385833A
公开(公告)日:2022-04-22
申请号:CN202210290077.1
申请日:2022-03-23
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 桂正科
Abstract: 本说明书实施例提供一种更新知识图谱的方法及装置,在为当前业务提供基于知识图谱的数据支持过程中,采用在线、离线相结合的方式更新知识图谱。首先,利用全量业务数据离线构建知识图谱,并进行全量的实体链指、实体归一,以初始化知识图谱。之后,设置增量更新条件进行多轮增量更新。在一轮增量更新期间,一方面,基于实时产生的业务数据进行实时链指提供在线的知识图谱更新,另一方面,在预设的增量更新条件满足时,按照当前增量更新周期内新增的业务数据进行增量链指,从而提供离线的知识图谱更新,并作为下一轮次增量更新的初始知识图谱。如此,可以使得相关业务处理结果更准确有效。
-
公开(公告)号:CN114357198A
公开(公告)日:2022-04-15
申请号:CN202210250454.9
申请日:2022-03-15
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种针对多个知识图谱的实体融合方法及装置。该方法及装置可以从多个父类知识图谱融合得到子类知识图谱。父类知识图谱包含若干种实体类型的实体节点以及表示实体节点之间关系的连接边。在方法执行时,确定待融合的第一类实体节点,获取多个父类知识图谱分别对应的数据文件和用于实体融合的配置信息,这些数据即为子类知识图谱的数据。数据文件包含若干个第一类实体节点的关系数据,配置信息中包含的指定关系类型,是从对应的父类知识图谱中第一类实体节点的关系数据具有的关系类型中选择的。当接收到针对子类知识图谱中第一类实体节点的查询请求时,利用多个数据文件和配置信息,确定第一类实体节点融合后的关系数据。
-
公开(公告)号:CN115168882A
公开(公告)日:2022-10-11
申请号:CN202210755174.3
申请日:2022-06-30
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 桂正科
Abstract: 本说明书实施例公开了一种图数据管理方法和系统。其中,该方法包括:从数据应用方接收图数据请求;确定与所述图数据请求对应的目标图数据和解密算子;其中,所述目标图数据中的至少部分数据经过加密算子加密,所述加密算子以及所述解密算子由目标图数据的数据提供方提供;通过所述解密算子对目标图数据中的加密数据进行解密,以便数据应用方使用目标图数据;获取并记录解密算子反馈的图数据调用信息,以便数据提供方查看。
-
公开(公告)号:CN113886605B
公开(公告)日:2025-01-24
申请号:CN202111243147.X
申请日:2021-10-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N5/025 , G06F16/36 , G06F16/353 , G06F40/295 , G06F40/30
Abstract: 本说明书实施例提供了一种知识图谱处理方法和系统,方法包括:基于目标业务域涉及的一个或多个实体类型从共享知识图谱中选取若干节点及其边,得到目标子图谱;所述共享知识图谱基于一个或多个业务域的知识图谱融合得到;对所述目标子图谱进行处理,以提取一种或多种图谱特征,所述图谱特征包括以下中的部分或全部:节点表征向量、边表征向量、图结构特征、图谱中文本信息的语义特征、图谱规则特征;将所述图谱特征提供给目标业务域的目标数据处理任务;其中,所述图谱特征用于与任务定制化特征一同作为所述目标数据处理任务的输入特征,以实现目标数据处理任务。
-
公开(公告)号:CN118940845A
公开(公告)日:2024-11-12
申请号:CN202411419984.7
申请日:2024-10-11
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N5/04 , G06N5/022 , G06F16/335 , G06F16/36 , G06F18/25
Abstract: 本说明书提供一种知识查询推理方法及装置、知识库系统,方法包括根据用户查询短语对知识图谱上的关联节点进行检索,并在根据关联节点未检索到查询结果的情况下,从知识图谱中获取与关联节点对应的文本信息,文本信息用于描述节点对应的事实知识,根据文本信息以及用户查询短语调用大语言模型生成查询结果。通过知识图谱中结构化知识与文本知识的融合表示,可以避免知识图谱过渡结构化带来的维度灾难和难以维护问题,降低成本和图谱复杂性,文本知识可以弥补结构化知识的上下文信息缺失问题;而且知识图谱中文本知识也可以弥补大语言模型的事实知识缺失问题,实现大语言模型与知识图谱性能的双向增强。
-
-
-
-
-
-
-
-
-