基于数据驱动的统计类大数据逻辑模型构建方法及系统

    公开(公告)号:CN115952979A

    公开(公告)日:2023-04-11

    申请号:CN202211601004.6

    申请日:2022-12-13

    摘要: 本发明提供了一种基于数据驱动的统计类大数据逻辑模型构建方法及系统,首先通过获取源端数据并将源端数据通过识别抽象处理得到第一数据;然后再将第一数据与SG‑CIM逻辑模型进行覆盖比对,并根据比对结果建立统计类大数据逻辑模型。其中,识别抽象处理先将输入的源端数据进行需求分析、抽象识别得到第一源数据;再将数据源对象通过抽象提取后输出得到第一数据。其中,抽象提取包括以下的一种或多种:规范、统一语义、去重、归并、整合和拆分。本发明实现了直接从数据现状入手,提取数据和逻辑关系并完成逻辑模型构建,从而在实现的时候速度快、效率高、质量高,同时本发明建立全能源行业统一逻辑模型,保证实体唯一,实现数据模型的真正统一标准。

    一种面向SG-CIM模型的实体对齐方法

    公开(公告)号:CN114911946A

    公开(公告)日:2022-08-16

    申请号:CN202210410226.3

    申请日:2022-04-19

    IPC分类号: G06F16/36 G06N3/04 G06N3/08

    摘要: 本发明提供了一种面向SG‑CIM模型的实体对齐方法,包括:对SG‑CIM模型中不同模型表知识图谱的三元组,进行规范化处理,生成一组关系三元组和一组属性三元组;将规范化处理后的关系三元组进行结构表示学习,将规范化处理后的属性三元组进行属性表示学习,并且,使用属性表示学习得到的实体向量,将结构表示学习得到的实体向量,转移到相同的向量空间中,进行联合学习;经过联合学习后,通过计算不同模型表知识图谱实体向量相似度,对不同模型表知识图谱实体进行对齐。本发明能很好解决国家电网SG‑CIM公共数据模型中模型表实体之间的错位不一致问题。