一种异构数据源的数据预处理方法

    公开(公告)号:CN106372185B

    公开(公告)日:2017-07-04

    申请号:CN201610789185.8

    申请日:2016-08-31

    IPC分类号: G06F17/30

    摘要: 本发明提供了一种异构数据源的数据预处理方法,包括以下步骤:从多个异构数据源中读取异构数据;基于预处理规则库对所述异构数据进行预处理得到规格化数据;将所述规格化数据存储在数据库中,用于数据集成、数据挖掘和/或企业的在线联机分析处理。其使得政法业务数据可以共享,该方法通用性好,易于扩展,并对数据进行递进式的三次预处理,且处理过程可以回溯,使得处理规则易于修改,提高了数据处理效率及处理精度,且能基于错误的日志修改提取规则,将数据统一存储提供对外服务。

    一种异构数据源的数据预处理方法

    公开(公告)号:CN106372185A

    公开(公告)日:2017-02-01

    申请号:CN201610789185.8

    申请日:2016-08-31

    IPC分类号: G06F17/30

    摘要: 本发明提供了一种异构数据源的数据预处理方法,包括以下步骤:从多个异构数据源中读取异构数据;基于预处理规则库对所述异构数据进行预处理得到规格化数据;将所述规格化数据存储在数据库中,用于数据集成、数据挖掘和/或企业的在线联机分析处理。其使得政法业务数据可以共享,该方法通用性好,易于扩展,并对数据进行递进式的三次预处理,且处理过程可以回溯,使得处理规则易于修改,提高了数据处理效率及处理精度,且能基于错误的日志修改提取规则,将数据统一存储提供对外服务。