-
公开(公告)号:CN113505605B
公开(公告)日:2024-12-31
申请号:CN202110837745.3
申请日:2021-07-23
Applicant: 国家电网有限公司大数据中心
IPC: G06F40/30 , G06F40/216
Abstract: 本发明公开了一种核心数据识别方法及系统,该方法包括:确定核心数据的评判因素;根据所述核心数据的评判因素划分出核心数据的各个判断因子以及所述各个判断因子的权重从而构建出核心数据识别模型;确定所述各个判断因子的算法模型;导入待识别核心数据的数据资源;根据所述核心数据识别模型以及所述算法模型对导入的数据资源进行核心数据的识别。本发明提供的核心数据识别方法及系统构建了核心数据识别模型,基于该核心数据识别模型可以快速自动识别出核心数据。
-
公开(公告)号:CN113505590A
公开(公告)日:2021-10-15
申请号:CN202110839335.2
申请日:2021-07-23
Applicant: 国家电网有限公司大数据中心
IPC: G06F40/279 , G06F40/30
Abstract: 本发明公开了一种基于实体消歧的数据库中的关键数据元素识别方法及系统,其包括:结合DeepType模型、DeepMatch模型以及DeepCosine模型对数据库中的数据进行实体类型的预测以及实体的消歧,其中,所述数据库中包括多个数据表;基于Apriori算法以及FP‑growth算法对消歧后的数据库中的数据进行关联分析从而构建数据库表关联图;基于所述数据库表关联图识别出关键数据元素;基于候选实体类型、上下文的关联信息以及候选实体向量对所述关键数据元素进行解析和消歧。本发明的基于实体消歧的数据库中的关键数据元素识别方法及系统,其实现了全电网一张数据库视图,便于及时获取电网中的关键数据元素,可以提高电网行业数据管理效率。
-
公开(公告)号:CN113505605A
公开(公告)日:2021-10-15
申请号:CN202110837745.3
申请日:2021-07-23
Applicant: 国家电网有限公司大数据中心
IPC: G06F40/30 , G06F40/216
Abstract: 本发明公开了一种核心数据识别方法及系统,该方法包括:确定核心数据的评判因素;根据所述核心数据的评判因素划分出核心数据的各个判断因子以及所述各个判断因子的权重从而构建出核心数据识别模型;确定所述各个判断因子的算法模型;导入待识别核心数据的数据资源;根据所述核心数据识别模型以及所述算法模型对导入的数据资源进行核心数据的识别。本发明提供的核心数据识别方法及系统构建了核心数据识别模型,基于该核心数据识别模型可以快速自动识别出核心数据。
-
公开(公告)号:CN111159180A
公开(公告)日:2020-05-15
申请号:CN201911308080.6
申请日:2019-12-18
Applicant: 国家电网有限公司大数据中心
IPC: G06F16/22 , G06F16/25 , G06F16/215 , G06F16/27 , G06F16/28 , G06F16/2457
Abstract: 本发明提供了一种基于数据资源目录构建的数据处理方法及系统,所述方法包括:对从各数据资源目录构建中采集到的电力信息化大数据进行分类并按数据类型存储;根据业务需求以及各数据资源目录构建从按数据类型存储的数据中选择出相应的数据,集中存储并进行处理,形成业务数据;将所述业务数据提供给用户;其中,所述数据资源目录构建基于数据库种类进行存储;所述数据类型包括模型数据、运行数据和统计分析数据。本发明提高了调控大数据在多个方面不同业务的数据性能。
-
-
-