面向海量异构数据的模式集成方法及装置

    公开(公告)号:CN107808001B

    公开(公告)日:2019-12-06

    申请号:CN201711116061.4

    申请日:2017-11-13

    Abstract: 本发明涉及一种面向海量异构数据知识库的模式集成方法,包括以下步骤:对知识库的数据进行处理,存储知识库中的边信息,形成边集,并构建聚类集合;采用编辑距离连接方法处理取自所述边集的模式集合,整合所述知识库中与所述模式集合中形式上相似的属性及相应的聚类集合;采用语义连接方法处理取自所述边集的模式集合,整合所述知识库中与所述模式集合中语义上相似的属性及相应的聚类集合;对编辑距离连接方法处理和语义连接方法处理所取得的结果集取并集,并进行假阳性检验。本发明还提供了一种面向海量异构数据知识库的模式集成装置。本发明提供的模式集成方法和装置可以对来自于异源知识库的模式进行高效准确的集成。

    面向海量异构数据的模式集成方法及装置

    公开(公告)号:CN107808001A

    公开(公告)日:2018-03-16

    申请号:CN201711116061.4

    申请日:2017-11-13

    Abstract: 本发明涉及一种面向海量异构数据知识库的模式集成方法,包括以下步骤:对知识库的数据进行处理,存储知识库中的边信息,形成边集,并构建聚类集合;采用编辑距离连接方法处理取自所述边集的模式集合,整合所述知识库中与所述模式集合中形式上相似的属性及相应的聚类集合;采用语义连接方法处理取自所述边集的模式集合,整合所述知识库中与所述模式集合中语义上相似的属性及相应的聚类集合;对编辑距离连接方法处理和语义连接方法处理所取得的结果集取并集,并进行假阳性检验。本发明还提供了一种面向海量异构数据知识库的模式集成装置。本发明提供的模式集成方法和装置可以对来自于异源知识库的模式进行高效准确的集成。

Patent Agency Ranking