-
公开(公告)号:CN106844338B
公开(公告)日:2019-12-10
申请号:CN201710002389.7
申请日:2017-01-03
Applicant: 北京交通大学
Abstract: 本发明提供了一种基于属性间依赖关系的网络表格的实体列的检测方法。针对一个网络表格,根据列值间的函数依赖关系计算任意两列间的近似函数依赖概率,根据所述近似函数依赖概率获取候选函数依赖集;根据网络表格的特点,删减候选函数依赖集中的噪声函数依赖得到近似函数依赖集;对近似函数依赖集进行3NF规范化,将3NF规范化后产生的主键集合作为网络表格的实体列。本发明提供的方法能更加准确地表达属性间内在的函数依赖关系;在计算近似函数依赖时基于一致性数据和不一致性数据对函数依赖的支持度,该算法具有明显的抗噪声能力,该方法不仅适用于单实体列的网络表格,还可用于多实体列的表格。
-
公开(公告)号:CN106844338A
公开(公告)日:2017-06-13
申请号:CN201710002389.7
申请日:2017-01-03
Applicant: 北京交通大学
Abstract: 本发明提供了一种基于属性间依赖关系的网络表格的实体列的检测方法。针对一个网络表格,根据列值间的函数依赖关系计算任意两列间的近似函数依赖概率,根据所述近似函数依赖概率获取候选函数依赖集;根据网络表格的特点,删减候选函数依赖集中的噪声函数依赖得到近似函数依赖集;对近似函数依赖集进行3NF规范化,将3NF规范化后产生的主键集合作为网络表格的实体列。本发明提供的方法能更加准确地表达属性间内在的函数依赖关系;在计算近似函数依赖时基于一致性数据和不一致性数据对函数依赖的支持度,该算法具有明显的抗噪声能力,该方法不仅适用于单实体列的网络表格,还可用于多实体列的表格。
-