一种基于碎片化文档的元数据识别方法、存储介质及系统

    公开(公告)号:CN115168589A

    公开(公告)日:2022-10-11

    申请号:CN202210920763.2

    申请日:2022-08-02

    Abstract: 本发明提供一种基于碎片化文档的元数据识别方法、存储介质及系统,该方法包括如下步骤:对预设文档进行读取,得到包含预设文档中的全部元素的元素体迭代器;对元素体迭代器进行元素遍历,识别出其所包含的全部元素当中的标题和表格,采用标题栈的数据结构来构建标题与表格之间的映射关系;基于预设的元模型对构建了映射关系的标题和表格进行关系元数据识别;识别表和字段的关系元数据,据此生成元数据更新脚本以更新元数据信息,如此则更新后的元数据信息包含了标题和表格之间的关系,使之完善。

    一种数据质量检查规则自适应方法、存储介质及系统

    公开(公告)号:CN114691662A

    公开(公告)日:2022-07-01

    申请号:CN202210344602.3

    申请日:2022-03-31

    Abstract: 本发明提供一种数据质量检查规则自适应方法、存储介质及系统,该方法包括:采集多个业务数据,从中提取对其进行描述的元数据,获取数据质量标准,据此生成数据质量检查规则,建立数据质量标准与数据质量检查规则的关联映射关系,利用数据质量检查规则对多个业务数据分别进行质量检查,若多个数据质量检查结果的异常率高于预设值,则展示数据质量标准供用户修改,获取用户修改后的数据质量标准,根据关联映射关系对应修改数据质量检查规则,利用修改后的数据质量检查规则对采集到的多个业务数据分别重新进行质量检查,直至多个新的数据质量检查结果的异常率不高于预设值,然后输出该基于同一个数据质量检查规则的多个新的数据质量检查结果。

    一种融合TF-IDF与贝叶斯算法的电网违章行为预警方法

    公开(公告)号:CN119474701A

    公开(公告)日:2025-02-18

    申请号:CN202411279165.7

    申请日:2024-09-12

    Abstract: 本发明公开了一种融合TF‑IDF与贝叶斯算法的电网违章行为预警方法,涉及机器学习技术领域,包括构建违章行为预测数据库,基于深度学习提取关键词并使用TF‑IDF算法对关键词进行加权;通过计算关键词的先验概率和条件概率矩阵,构建权重矩阵计算关键词之间的权重;将新数据输入到数据库中,通过权重矩阵和贝叶斯算法计算最终预警概率。本发明所述方法通过构建权重矩阵计算关键词之间的权重,提高关键词在电网违章行为预警中的相对重要性,提高预警的准确性;通过动态更新权重矩阵,能够根据电网违章行为的实际情况动态调整权重,提高预警系统的灵活性和适应性,本发明在准确性、灵活性以及适应性方面都取得更加良好的效果。

    一种数据质量检查规则有效性评估及反馈优化方法、存储介质及系统

    公开(公告)号:CN114926057A

    公开(公告)日:2022-08-19

    申请号:CN202210606874.6

    申请日:2022-05-31

    Abstract: 本发明提供一种数据质量检查规则有效性评估及反馈优化方法、存储介质及系统,该方法包括:从数据质量检查规则集当中选取出需评估的第一数据质量检查规则,根据多项质量规则评估指标构建数据质量检查规则评估体系,利用各项质量规则评估指标对第一数据质量检查规则进行评估得到评分,结合各项质量规则评估指标的评分和权重分配情况计算得到有效性评估结果,若有效性评估结果没有达到第一预设程度则从数据质量知识库中找出相似度最高的第二数据质量检查规则,若该相似度达到第二预设程度则利用第二数据质量检查规则所关联的优化知识对第一数据质量检查规则进行优化,然后根据优化后的第一数据质量检查规则更新数据质量检查规则集。

    一种基于专业化需求的系统实用化监控方法

    公开(公告)号:CN107239894A

    公开(公告)日:2017-10-10

    申请号:CN201710385551.8

    申请日:2017-05-26

    Abstract: 一种基于专业化需求的系统实用化监控方法,步骤是:(一)建立需求模型完成系统监控及评价方法的分析,形成一个合理有效的需求模型;(二)建立聚合模型结合基础数据并套用指标公式,计算出聚合结果。构建一套反应业务需求的数据聚合模型;(三)监控实现对在需求模型中所收集到的多源数据进行融合后,完成报表数据源配置,套用指标公式,生成报表展示数据集等,得出满足各业务部门需求的实用化监控数据。本发明的有益效果是:1、提升精益化管理水平;2、提高经济效益;3、实时监控评估系统实用化水平,提升数据安全性。

    一种数据质量检查规则匹配方法、存储介质及系统

    公开(公告)号:CN115328902B

    公开(公告)日:2025-05-16

    申请号:CN202211049853.5

    申请日:2022-08-30

    Abstract: 本发明提供一种数据质量检查规则匹配方法、存储介质及系统,该方法包括:采集多个字段元数据和多个数据质量检查规则,计算各个字段元数据与各个数据质量检查规则之间的关联度,令关联度达标的字段元数据与数据质量检查规则相匹配,识别已匹配数据质量检查规则的候选字段元数据和未匹配数据质量检查规则的待匹配字段元数据,若存在与待匹配字段元数据文本相似度大于预设阈值且数据类型一致的候选字段元数据,则将用户选择的数据质量检查规则所包含的参数信息替换成待匹配字段元数据的数据信息,将条件参数替换成用户输入的新条件参数,得到新数据质量检查规则并令待匹配字段元数据与其相匹配。

Patent Agency Ranking