-
公开(公告)号:CN116595984A
公开(公告)日:2023-08-15
申请号:CN202310673279.9
申请日:2023-06-07
IPC分类号: G06F40/295 , G06F40/216 , G06F18/22
摘要: 本申请提供一种实体对齐方法、装置、设备及存储介质,通过对目标实体和多个候选实体的名称信息、属性信息以及关系信息进行映射,获得目标实体的名称向量、属性向量、关系向量和每个候选实体的名称向量、属性向量、关系向量;针对每个候选实体,根据目标实体和每个候选实体的名称向量、属性向量、关系向量,获得目标实体与候选实体之间的名称相似度值,属性相似度向量,以及关系相似度向量;将目标实体与候选实体之间的名称相似度值、属性相似度向量,关系相似度向量进行拼接,获得目标实体与候选实体之间的相似度值;基于相似度值,实现实体对齐。由于在实体对齐过程中,综合考虑实体的名称信息、属性信息和关系信息,有效提高实体对齐的效率。
-
公开(公告)号:CN115982377A
公开(公告)日:2023-04-18
申请号:CN202211618019.3
申请日:2022-12-15
申请人: 国家电网有限公司大数据中心 , 北京中电普华信息技术有限公司
摘要: 本申请公开了一种电网信息的处理方法及装置、电子设备、存储介质,所述方法包括:获取电网公共信息模型的原始文件,并基于该原始文件构建电网信息知识图谱;从电网信息知识图谱选取出多个待预测对象;一个待预测对象包括一个实体节点和一个实体关系;将各个待预测对象输入链接预测模型中,通过链接预测模型中的编码器计算待预测对象中的实体节点的向量,并通过链接预测模型中的解码器基于待预测对象中的实体节点和多个随机实体节点向量的向量,计算由各个待预测对象和随机实体节点组成的多个目标三元组的得分;将各个目标三元组按照得分进行升序排序;将排序在前N位,且未存在于电网信息知识图谱中的各个目标三元组添加至电网信息知识图谱中。
-
公开(公告)号:CN116010615A
公开(公告)日:2023-04-25
申请号:CN202211682651.4
申请日:2022-12-27
申请人: 国家电网有限公司大数据中心 , 北京中电普华信息技术有限公司
IPC分类号: G06F16/36 , G06F18/22 , G06N3/045 , G06N3/0464 , G06N3/042
摘要: 本申请提供一种实体的对齐方法、装置、电子设备及计算机存储介质,该方法包括:对获取得到的物理模型知识图谱和逻辑模型知识图谱进行预处理,得到物理模型知识图谱的关系三元组和属性三元组,以及逻辑模型知识图谱的关系三元组和属性三元组;将其输入至多层图卷积神经网络,得到知识图谱中的实体的嵌入表示;针对每一个实体,计算实体的邻居节点的跨图匹配向量;根据实体的邻居节点的跨图匹配向量和实体的嵌入表示,确定实体的目标嵌入表示;对知识图谱中的实体进行聚合,得到优化后的实体的嵌入表示;根据知识图谱中实体优化后的嵌入表示和另一知识图谱中实体的向量化表达,确定两个知识图谱实体之间的距离,从而实现两个图谱中的实体的对齐。
-
公开(公告)号:CN116757285A
公开(公告)日:2023-09-15
申请号:CN202310696518.2
申请日:2023-06-12
申请人: 国家电网有限公司大数据中心
摘要: 本发明公开了一种电网知识推理方法、装置、电子设备和存储介质,其中,该方法包括:根据邻域阈值距离以及预设聚类规则调整预设知识图谱内待调整元素;基于调整后的所述预设知识图谱确定电网知识推理模型;根据所述电网知识推理模型以及分布式计算平台确定知识推理结果。本发明实施例解决了知识图谱缺少属性和关系的问题,可增强知识图谱数据的完备性,而通过分布式平台增强知识图谱应用可伸缩差的问题,能够处理知识图谱所处环境的开放性和封闭性之间的矛盾,提高了知识图谱的准确性和可靠性。
-
公开(公告)号:CN116881466A
公开(公告)日:2023-10-13
申请号:CN202310694018.5
申请日:2023-06-12
申请人: 国家电网有限公司大数据中心
摘要: 本发明公开了一种知识图谱的信息确定方法、装置、设备以及存储介质,其中,该方法包括:确定预设知识图谱的原始图对应的数据采样图;基于阈值支持度确定所述数据采样图的频繁边集;根据所述频繁边集拓展所述数据采样图的子图为采样拓展图;基于预设编码规则确定所述采样拓展图的采样编码。本发明实施例实现挖掘预设知识图谱的采样编码的生成,提升了预设知识图谱内数据采样覆盖的分布稳定,可提高知识图谱挖掘的准确性和可靠性。
-
公开(公告)号:CN114064749A
公开(公告)日:2022-02-18
申请号:CN202111264880.X
申请日:2021-10-28
申请人: 国家电网有限公司大数据中心
发明人: 沈亮 , 周春雷 , 朱广新 , 陈翔 , 张鹏宇 , 廖小琦 , 吴桂栋 , 王春梅 , 江鹏 , 郝保聪 , 李杏 , 李雨霏 , 葛鑫亮 , 任小伟 , 胡锡双 , 王洁 , 杨诗语 , 温阳
IPC分类号: G06F16/2458 , G06F16/28 , G06Q50/06
摘要: 本公开提供一种电网公共数据中实体关系确定的方法,包括:获取项;根据所述项获取项集和所述项集的参数;从所述项集中选取参数不小于阈值的初始项集;获取关系组;以及从所述关系组中确定所述初始项集的关系。本公开的关系确定方法能够确定实体‑关系三元组之间的关系。
-
公开(公告)号:CN115934801B
公开(公告)日:2024-08-02
申请号:CN202211599310.0
申请日:2022-12-12
申请人: 国家电网有限公司大数据中心
IPC分类号: G06F16/2458 , G06F16/22 , G06F16/25
摘要: 本发明公开了一种统计类数据模型构建方法、装置、电子设备及存储介质。其中,该方法包括:获取至少一个源端数据内多源异构统计类能源数据的数据对象;将数据对象拆分为事实数据对象和维度数据对象;按照业务含义将不同事实数据对象和维度数据对象合并为正式数据对象;根据正式数据对象构建面向多源异构统计类能源的数据模型,确定面向多源异构统计类能源的数据模型与多源异构统计类能源数据的映射关系。本发明实施例,通过将多源异构统计类能源数据处理为正式数据对象并构建面向多源异构统计类能源的数据模型,实现了将多源异构统计类能源数据整合转换为面向多源异构统计类能源的数据模型,从而实现多源异构统计类能源数据标准统一、融合共享。
-
公开(公告)号:CN115952979A
公开(公告)日:2023-04-11
申请号:CN202211601004.6
申请日:2022-12-13
申请人: 国家电网有限公司大数据中心
IPC分类号: G06Q10/0631 , G06Q50/06 , G06F18/00
摘要: 本发明提供了一种基于数据驱动的统计类大数据逻辑模型构建方法及系统,首先通过获取源端数据并将源端数据通过识别抽象处理得到第一数据;然后再将第一数据与SG‑CIM逻辑模型进行覆盖比对,并根据比对结果建立统计类大数据逻辑模型。其中,识别抽象处理先将输入的源端数据进行需求分析、抽象识别得到第一源数据;再将数据源对象通过抽象提取后输出得到第一数据。其中,抽象提取包括以下的一种或多种:规范、统一语义、去重、归并、整合和拆分。本发明实现了直接从数据现状入手,提取数据和逻辑关系并完成逻辑模型构建,从而在实现的时候速度快、效率高、质量高,同时本发明建立全能源行业统一逻辑模型,保证实体唯一,实现数据模型的真正统一标准。
-
公开(公告)号:CN114911946A
公开(公告)日:2022-08-16
申请号:CN202210410226.3
申请日:2022-04-19
申请人: 国家电网有限公司大数据中心
摘要: 本发明提供了一种面向SG‑CIM模型的实体对齐方法,包括:对SG‑CIM模型中不同模型表知识图谱的三元组,进行规范化处理,生成一组关系三元组和一组属性三元组;将规范化处理后的关系三元组进行结构表示学习,将规范化处理后的属性三元组进行属性表示学习,并且,使用属性表示学习得到的实体向量,将结构表示学习得到的实体向量,转移到相同的向量空间中,进行联合学习;经过联合学习后,通过计算不同模型表知识图谱实体向量相似度,对不同模型表知识图谱实体进行对齐。本发明能很好解决国家电网SG‑CIM公共数据模型中模型表实体之间的错位不一致问题。
-
公开(公告)号:CN115934801A
公开(公告)日:2023-04-07
申请号:CN202211599310.0
申请日:2022-12-12
申请人: 国家电网有限公司大数据中心
IPC分类号: G06F16/2458 , G06F16/22 , G06F16/25
摘要: 本发明公开了一种统计类数据模型构建方法、装置、电子设备及存储介质。其中,该方法包括:获取至少一个源端数据内多源异构统计类能源数据的数据对象;将数据对象拆分为事实数据对象和维度数据对象;按照业务含义将不同事实数据对象和维度数据对象合并为正式数据对象;根据正式数据对象构建面向多源异构统计类能源的数据模型,确定面向多源异构统计类能源的数据模型与多源异构统计类能源数据的映射关系。本发明实施例,通过将多源异构统计类能源数据处理为正式数据对象并构建面向多源异构统计类能源的数据模型,实现了将多源异构统计类能源数据整合转换为面向多源异构统计类能源的数据模型,从而实现多源异构统计类能源数据标准统一、融合共享。
-
-
-
-
-
-
-
-
-