一种基于数据分布的大数据查询方法

    公开(公告)号:CN108520053B

    公开(公告)日:2020-03-31

    申请号:CN201810300996.6

    申请日:2018-04-04

    Applicant: 东北大学

    Abstract: 本发明提供一种基于数据分布的大数据查询方法,涉及大数据查询技术领域。一种基于数据分布的大数据查询方法,首先对待查询的数据划分数据段,并根据加速比计算整体数据段的段势分布函数,以确定各数据段的数量比例关系;然后根据约束条件将待查询数据装载到各数据段内;最后根据用户查询请求的时限要求,采用数据段选择算法确定参与查询的数据段,并返回查询结果及实际查全率和置信度。本发明提供的基于数据分布的大数据查询方法,保证了分布式环境下各类查询的随机性、性能和近似性评价,并兼容精确查询,且新增数据不会影响查询效果,具备良好的扩展性和可维护性。

    一种基于数据分布的大数据查询方法

    公开(公告)号:CN108520053A

    公开(公告)日:2018-09-11

    申请号:CN201810300996.6

    申请日:2018-04-04

    Applicant: 东北大学

    Abstract: 本发明提供一种基于数据分布的大数据查询方法,涉及大数据查询技术领域。一种基于数据分布的大数据查询方法,首先对待查询的数据划分数据段,并根据加速比计算整体数据段的段势分布函数,以确定各数据段的数量比例关系;然后根据约束条件将待查询数据装载到各数据段内;最后根据用户查询请求的时限要求,采用数据段选择算法确定参与查询的数据段,并返回查询结果及实际查全率和置信度。本发明提供的基于数据分布的大数据查询方法,保证了分布式环境下各类查询的随机性、性能和近似性评价,并兼容精确查询,且新增数据不会影响查询效果,具备良好的扩展性和可维护性。

Patent Agency Ranking