-
公开(公告)号:CN108509618B
公开(公告)日:2020-03-31
申请号:CN201810300980.5
申请日:2018-04-04
Applicant: 东北大学
IPC: G06F16/22 , G06F16/28 , G06F16/2455
Abstract: 本发明提供一种基于空间填充曲线的大数据多维数据索引方法,涉及大数据环境下数据索引技术领域。该方法首先利用一种新的空间填充曲线Flat‑zorder对文件中的每条记录进行线性化,然后根据线性化结果与文件名之间的对应关系,实现索引的创建、数据的检索以及索引更新与维护。Flat‑zorder空间填充曲线只要求维之间按照整数比进行扩展,既保留了线性化id值在每个维上的连续性又具有可接受的复杂性和时间复杂度。本发明提供的基于空间填充曲线的大数据多维数据索引方法,与传统的多维数据索引相比,提高了索引创建和更新的效率,加快了数据检索的速度,减小了索引文件的大小,同时支持精确匹配查询和范围查询。
-
公开(公告)号:CN105677840A
公开(公告)日:2016-06-15
申请号:CN201610005893.8
申请日:2016-01-06
Applicant: 东北大学
IPC: G06F17/30
CPC classification number: G06F17/30333 , G06F17/30584
Abstract: 本发明一种基于多维渐增数据模型的数据查询方法,属于数据查询技术领域,本发明将某些频繁出现的键建立成为集合空间中的维,并根据值(value)在维上进行分段,而对于那些出现次数较少的键定义为平凡键,通过这样的方式,所有的数据都会被组织成一个高维的模型,简称为key-cube(键立方);在查询过程中,符合查询条件的数据会被锁定在相关的cell(单元格)之中,因此查询的范围大大的减小了;其次这个数据模型具有一定的适应性会根据数据中键值对出现的次数从而做出相应的反应;这个key-cube是渐增式的,随着键值中数据的增多,此模型会根据键的频繁程度拓展出新的维,从而形成新的key-cube。
-
公开(公告)号:CN105677840B
公开(公告)日:2019-02-05
申请号:CN201610005893.8
申请日:2016-01-06
Applicant: 东北大学
Abstract: 本发明一种基于多维渐增数据模型的数据查询方法,属于数据查询技术领域,本发明将某些频繁出现的键建立成为集合空间中的维,并根据值(value)在维上进行分段,而对于那些出现次数较少的键定义为平凡键,通过这样的方式,所有的数据都会被组织成一个高维的模型,简称为key‑cube(键立方);在查询过程中,符合查询条件的数据会被锁定在相关的cell(单元格)之中,因此查询的范围大大的减小了;其次这个数据模型具有一定的适应性会根据数据中键值对出现的次数从而做出相应的反应;这个key‑cube是渐增式的,随着键值中数据的增多,此模型会根据键的频繁程度拓展出新的维,从而形成新的key‑cube。
-
公开(公告)号:CN108509618A
公开(公告)日:2018-09-07
申请号:CN201810300980.5
申请日:2018-04-04
Applicant: 东北大学
IPC: G06F17/30
Abstract: 本发明提供一种基于空间填充曲线的大数据多维数据索引方法,涉及大数据环境下数据索引技术领域。该方法首先利用一种新的空间填充曲线Flat-zorder对文件中的每条记录进行线性化,然后根据线性化结果与文件名之间的对应关系,实现索引的创建、数据的检索以及索引更新与维护。Flat-zorder空间填充曲线只要求维之间按照整数比进行扩展,既保留了线性化id值在每个维上的连续性又具有可接受的复杂性和时间复杂度。本发明提供的基于空间填充曲线的大数据多维数据索引方法,与传统的多维数据索引相比,提高了索引创建和更新的效率,加快了数据检索的速度,减小了索引文件的大小,同时支持精确匹配查询和范围查询。
-
-
-