基于分布拟合的网络表格间的外键关系检测方法

    公开(公告)号:CN109472013B

    公开(公告)日:2020-06-16

    申请号:CN201811250624.3

    申请日:2018-10-25

    Inventor: 王宁 王佳敏

    Abstract: 本发明提供了一种基于分布拟合的网络表格间的外键关系检测方法。该方法包括:检测网络表格间不同属性列之间的包含覆盖关系,根据包含覆盖关系的检测结果筛选出所述网络表格间的候选外键关系对;构建候选外键关系对中候选外键和候选主键的多维分布图,计算出候选外键和候选主键的多维分布图之间的拟合度;根据候选外键和候选主键的多维分布图之间的拟合度判断候选外键关系对是否为真正的外键关系对。本发明既适用于字符类型的外键关系检测,也适用于数字类型的外键关系检测,既能检测单列的外键关系,也能检测多列的外键关系,在具有较高的检测准确性的同时兼具较高的检测效率。

    基于分布拟合的网络表格间的外键关系检测方法

    公开(公告)号:CN109472013A

    公开(公告)日:2019-03-15

    申请号:CN201811250624.3

    申请日:2018-10-25

    Inventor: 王宁 王佳敏

    Abstract: 本发明提供了一种基于分布拟合的网络表格间的外键关系检测方法。该方法包括:检测网络表格间不同属性列之间的包含覆盖关系,根据包含覆盖关系的检测结果筛选出所述网络表格间的候选外键关系对;构建候选外键关系对中候选外键和候选主键的多维分布图,计算出候选外键和候选主键的多维分布图之间的拟合度;根据候选外键和候选主键的多维分布图之间的拟合度判断候选外键关系对是否为真正的外键关系对。本发明既适用于字符类型的外键关系检测,也适用于数字类型的外键关系检测,既能检测单列的外键关系,也能检测多列的外键关系,在具有较高的检测准确性的同时兼具较高的检测效率。

Patent Agency Ranking