一种数据质量校验规则提取方法及系统

    公开(公告)号:CN113987190B

    公开(公告)日:2023-02-28

    申请号:CN202111356033.6

    申请日:2021-11-16

    Abstract: 本发明公开了一种数据质量校验规则提取方法及系统,方法包括:扫描元数据,获取数据类型为文本型的字段,标记字段描述中含有取值范围信息的字段并存储取值范围信息;根据元数据信息,扫描文本型字段值,生成字段的值结构与每种值结构的取值占比;对字段生成的值结构类别进行评分,选出其中的可信类别;然后利用可信值结构类别和元数据信息生成字段取值质量校验规则;最后将校验规则入库,生成字段‑规则映射关系,从而实现了文本型数据质量校验规则的有效提取。与现有规则生成方法相比,本发明能大幅提高数据质量规则生成效率和准确度,减轻劳动力,具有更高的实用价值。

    一种异常检测模型训练方法、异常检测方法及装置

    公开(公告)号:CN115456067A

    公开(公告)日:2022-12-09

    申请号:CN202211083445.1

    申请日:2022-09-06

    Abstract: 本发明提供了一种异常检测模型训练方法、异常检测方法及装置,其中,异常检测模型训练方法包括:获取初始训练集;将初始训练集中的样本分别输入不同的异常分类模型进行预测,并根据预测类别进行标签标记;基于各样本对应的预测类别和标签分别计算各样本的投票熵;对投票熵大于熵值阈值的样本进行目标标记;利用带有目标标记的样本对目标异常分类模型进行训练,得到训练好的目标异常分类模型。在最大化提高异常检测模型准确率的同时,大幅降低由于过度依赖特征工程或对异常模式的挖掘单一导致异常检测假阳性概率过高的情况发生。

    一种数据管理方法及装置
    28.
    发明公开

    公开(公告)号:CN114880406A

    公开(公告)日:2022-08-09

    申请号:CN202210482742.7

    申请日:2022-05-05

    Abstract: 本发明提供了一种数据管理方法及装置,该方法包括:结合多个系统的业务数据为多个主题域中的各业务实体建立主数据,业务数据中包含各业务实体的实体信息;根据第一判别模型和主数据,对第一初始关联关系进行一致性校核,基于校核结果对第一初始关联关系进行调整,得到第一关联关系;根据第二判别模型和主数据,对第二初始关联关系进行一致性校核,基于校核结果对第二初始关联关系进行调整,得到第二关联关系;结合第一关联关系、第二关联关系建立实体‑关系主数据。通过执行本发明得到的各业务实体主数据更完整,且建立的实体‑关系主数据能够实现非直接相邻的业务实体之间的关联映射以及与相关业务实体关键属性信息的快速搜索和共享。

    电动汽车碳减排量核算方法、装置及电子设备

    公开(公告)号:CN114722329A

    公开(公告)日:2022-07-08

    申请号:CN202210649972.8

    申请日:2022-06-10

    Abstract: 本发明实施例涉及一种电动汽车碳减排量核算方法、装置及电子设备。包括:获取电动汽车在核算期内的充电电量和放电电量;基于区域电网碳排放因子,确定区域用电二氧化碳排放系数;基于电动汽车‑燃油汽车能量转换二氧化碳排放系数和区域用电二氧化碳排放系数,确定电动汽车区域用电碳减排因子;将充电电量和放电电量、区域用电二氧化碳排放系数及电动汽车区域用电碳减排因子,输入到预设的电动汽车碳减排核算模型,获得电动汽车碳减排量。通过该方式,针对碳积分核定与交易需求,在缺少碳排放量责任核定的现状下,根据电动汽车碳减排核算模型,实现电动汽车用电行驶替代传统油车用油行驶和向电网放电替代传统能源发电所减排的二氧化碳量核算。

    一种块稀疏化及负载的均衡方法、装置、设备及介质

    公开(公告)号:CN118733265A

    公开(公告)日:2024-10-01

    申请号:CN202410849661.5

    申请日:2024-06-27

    Abstract: 本发明属于计算机技术领域,公开一种块稀疏化及负载的均衡方法、装置、设备及介质,所述方法包括:获取原始权重矩阵,所述原始权重矩阵包括多个权重系数;对获取的原始权重矩阵进行预处理获得预处理后权重矩阵;所述预处理后权重矩阵中对角线区域稠密度高于原始权重矩阵对角线区域稠密度;对预处理后权重矩阵进行划分,得到多个矩阵块,每个矩阵块对应分配一个众核系统的核心进行处理。本发明把一个全局均稀疏的矩阵,变为局部稠密其余系数的矩阵,在通过核心进行运算时,相对处理前的矩阵,实现更多在稠密计算上,从而提高计算效率。解决了通过众核系统进行脑仿真时,超大规模矩阵所带来的计算难度大以及负载不均匀的技术问题。

Patent Agency Ranking