一种基于蕴涵规则的数据质量自动检测方法

    公开(公告)号:CN102411600B

    公开(公告)日:2013-05-15

    申请号:CN201110218907.1

    申请日:2011-08-02

    Applicant: 暨南大学

    Inventor: 刘波 许阳阳 赖伟

    Abstract: 本发明公开了一种基于蕴涵规则的数据质量自动检测方法,该方法首先需选择检测对象,定义或修改检测对象及其之间的蕴涵规则,并将规则存储到规则库中;然后从规则库中读取与检测对象有关的、且尚未读取过的、且元组变量列表相同的规则,将它们存入清空的规则临时表中,然后计算检测关系中违背规则临时表中规则的元组,并将这些元组放入一个集合中;如果规则库中已不存在与检测对象有关的、且尚未读取过的规则,则输出违背规则库中与检测对象有关的规则的所有元组,提供给用户修复。该方法通用性强,且检测速度快,形式简洁,使用与维护方便,独立性和灵活性强,不依赖于数据库管理系统,适用于检测任何关系型数据库或结构化文件。

    一种基于蕴涵规则的数据质量自动检测方法

    公开(公告)号:CN102411600A

    公开(公告)日:2012-04-11

    申请号:CN201110218907.1

    申请日:2011-08-02

    Applicant: 暨南大学

    Inventor: 刘波 许阳阳 赖伟

    Abstract: 本发明公开了一种基于蕴涵规则的数据质量自动检测方法,该方法首先需选择检测对象,定义或修改检测对象及其之间的蕴涵规则,并将规则存储到规则库中;然后从规则库中读取与检测对象有关的、尚未读取过的、元组变量列表相同的规则,将它们存入清空的规则临时表中,然后计算检测关系中违背规则临时表中规则的元组,并将这些元组放入一个集合中;如果规则库中已不存在与检测对象有关的、尚未读取过的规则,则输出违背规则库中与检测对象有关的规则的所有元组,提供给用户修复。该方法通用性强,且检测速度快,形式简洁,使用与维护方便,独立性和灵活性强,不依赖于数据库管理系统,适用于检测任何关系型数据库或结构化文件。

Patent Agency Ranking