-
公开(公告)号:CN115292422A
公开(公告)日:2022-11-04
申请号:CN202211092517.9
申请日:2022-09-08
Applicant: 广东电网有限责任公司
IPC: G06F16/28 , G06F16/242 , G06F16/21 , H02J3/00
Abstract: 本发明公开了一种基于电网数据仓库模型的自动构建多维模型方法,该方法包括下述步骤:基于DV建模方法构建电网数据仓库模型;将电网数据仓库模型的中心点或链接表合并入附属表,保留原模型的关系,形成用户视图;将用户视图映射到电网数据仓库模型,形成第一映射表;将电网数据仓库模型按照DV模型的演化方式转换为半维度模型,构建由电网数据仓库模型映射到半维度模型的第二映射表;将多维模型用户视图映射到半维度模型,形成多维模型用户视图和第三映射表。本发明利用电网业务的特征和操纵映射运算规则,从DV数据仓库模型自动构建多维数据模型,达到高效、高质量、跨区域地构建数据模型。
-
公开(公告)号:CN115269552A
公开(公告)日:2022-11-01
申请号:CN202210902836.5
申请日:2022-07-29
Applicant: 广东电网有限责任公司
IPC: G06F16/21 , G06F16/22 , G06F16/23 , G06F16/2458 , G06F16/28
Abstract: 本发明公开了一种电网数据仓库多版本元数据存储及一致性检测方法,该方法包括下述步骤:构建电网Data Vault(DV)数据仓库;构建面向电网DV数据仓库环境的元模型,包括DV模式和多维(MD)模式部分;进行DV模式的元数据一致性检测;进行MD模式的元数据一致性检测;进行属性表Attributes完整性约束的一致性检测;进行DV模式与MD模式的元数据一致性检测;本发明利用电网元数据存储库的元模型,分别检验数据仓库区、数据集市区,以及数据仓库和数据集市之间的多版本元数据一致性关系。本发明能够在电网元数据层面自动发现元数据缺失、重复和冲突情况,从而达到提升电网数据质量的目的。
-
公开(公告)号:CN115658819A
公开(公告)日:2023-01-31
申请号:CN202211253699.3
申请日:2022-10-13
Applicant: 广东电网有限责任公司
Abstract: 本发明公开了一种电网数据仓库模型与多维模型的同步匹配方法,该方法具体步骤包括:构建电网数据仓库模型,电网数据仓库模型主要包括DV数据仓库模型和多维模型两部分;DV数据仓库模型包括中心点表、链接表、附属表,以及范式用户视图构成;多维模型由半维度模型、事实表和维度表的多维用户视图构成;当多维用户视图因用户分析需求改变后,利用对模型和映射的逆向操纵方式,自动同步半维度模型和DV数据仓库模型,在用户视图与模型、模型与模型之间建立映射表,实现电网DV数据仓库模型与多维模型的自动同步。本发明能够在数据模式层面,实现高效、高质量地逆向自动同步模式演化方法,从而达到提升电网数据仓库数据质量的目的。
-
公开(公告)号:CN115391323A
公开(公告)日:2022-11-25
申请号:CN202211052825.9
申请日:2022-08-30
Applicant: 广东电网有限责任公司
IPC: G06F16/215 , G06F16/2458
Abstract: 本发明公开了一种基于电网数据仓库的自动提取函数依赖方法,该方法包括下述主要步骤:构建电网DV数据仓库;根据电网数据特征,检测函数依赖候选的成立模式;基于电网业务键自身与证据属性的数据语义,计算业务键的数据置信度、业务实体关联记录的数据置信度;根据设定的置信度阈值,计算函数依赖候选的数据置信度;最终输出所有成立的函数依赖候选。本发明克服因多源数据不一致带来的数据噪音干扰,解决了从多对多的链接表中自动提取函数依赖的技术问题,提高了计算不同实体属性数据及其记录置信度的准确性,实现高效、高质量的数据语义关系抽取,从而为自动构建多维模型奠定基础。
-
公开(公告)号:CN115309725A
公开(公告)日:2022-11-08
申请号:CN202211045987.X
申请日:2022-08-30
Applicant: 广东电网有限责任公司
Abstract: 本发明公开了一种基于本体的电网数据仓库自动数据加载方法,该方法包括下述步骤:配置与数据准备,构建电网DV数据仓库的中心点及其附属表;进行标杆表和次要表的模式匹配和数据匹配,构建近似业务键匹配表并进行业务键值近似匹配;查找业务对象对应的表并存入标杆表和次要表的数据,查找标杆表中是否有外键字段指向本表记录以及标杆表中是否有外键指向其他关系表,重复数据加载过程,直至完成多个次要表的数据加载过程;确定关联业务对象的关系并加载数据,查找链接表,将暂存区域标杆表和次要表的关联数据加载至链接表。本发明从多个电网源业务系统的数据表中高效地抽取源数据,并准确加载到电网DV数据仓库,其容纳不一致数据的存储方式,保证了数据的可跟踪性和可审计性。
-
公开(公告)号:CN115544181A
公开(公告)日:2022-12-30
申请号:CN202211303472.5
申请日:2022-10-24
Applicant: 广东电网有限责任公司
Abstract: 本发明公开了一种基于本体的电网数据集市自动数据加载方法,该方法包括下述步骤:基于DV建模方法构建电网数据仓库;建立DV不一致数据检测和修复数据集;检测中心点及其附属表,验证数据依赖关系及其成立模式;检测、计算数据语义置信度并确定修复值;构建电网数据集市;建立临时维度表、修复不一致数据并加载维度表数据;建立临时事实表、修复不一致数据并加载事实表数据。本发明利用本体知识库、函数依赖关系和数据语义置信度计算方法,在不变更电网DV数据仓库的情况下,检测和修复不一致数据,实现DV不一致数据的有效管理,最终达到高质量地自动加载电网数据集市的目标。
-
公开(公告)号:CN115544178A
公开(公告)日:2022-12-30
申请号:CN202211253685.1
申请日:2022-10-13
Applicant: 广东电网有限责任公司
Abstract: 本发明公开了一种基于电网DV数据仓库的自动生成多维模型方法,该方法包括下述步骤:构建电网DV数据仓库,电网DV数据仓库模型包括DV数据仓库模型和多维模型,DV数据仓库模型包括中心点表、链接表、附属表三种类型表,多维模型由事实表和维度表及其层次结构组成;通过遍历链接表相关中心点表,生成事实表属性和维度表属性及其关系;结合链接表中业务实体间的函数依赖,利用附属表数据验证业务实体中属性间的依赖关系,抽取实体中隐含的函数依赖关系;利用函数依赖关系,基于多维模型候选表构造和优化多维模型候选;遍历多维模型候选表,输出多维模型。本发明能够在数据和模式两个层面,利用数据语义置信度方法,借助电网模型的命名规则等特点,约简和生成多维模型,最终高效、高质量地生成DV数据仓库的多维模型。
-
-
-
-
-
-