-
公开(公告)号:CN106528833A
公开(公告)日:2017-03-22
申请号:CN201611033076.X
申请日:2016-11-14
Applicant: 天津南大通用数据技术股份有限公司
IPC: G06F17/30
CPC classification number: G06F16/21 , G06F16/24552
Abstract: 本发明提供了一种MPP数据库数据动态重分布的方法及装置,其中,所述方法包括:在每个节点划分缓存空间,所述缓存空间用于缓存重分布数据;判断所述缓存空间是否包括动态重分布需求对应的数据,在所述缓存空间包括动态重分布需求对应的数据时,使用所述缓存空间中的所述数据。通过在本地设置缓存,并在重分布时优先使用缓存中的数据。减少MPP数据库集群节点间的通讯,提升本地化运算比例,从而提升集群整体性能。
-
公开(公告)号:CN104376119A
公开(公告)日:2015-02-25
申请号:CN201410729620.9
申请日:2014-12-03
Applicant: 天津南大通用数据技术股份有限公司
IPC: G06F17/30
CPC classification number: G06F17/30315 , G06F17/30333
Abstract: 本发明旨在提供一种在超大规模列存数据库中快速定位及访问数据的方法。包括,将列存数据根据特征进行数据块划分,对全部数据块建立多阶特征索引。本发明中数据的特征划分使同类数据相聚合,降低数据块内部离散度,访问更加精准。而高阶索引可以加快数据过滤速度,并有效控制对低阶索引和数据的访问。以上两种方式将大量减少内存与I/O设备间的数据交换,提高数据库运行效率。
-
公开(公告)号:CN106354829A
公开(公告)日:2017-01-25
申请号:CN201610777661.4
申请日:2016-08-31
Applicant: 天津南大通用数据技术股份有限公司
IPC: G06F17/30
CPC classification number: G06F16/221
Abstract: 本发明提供了一种列存数据库的物化方法及装置,其中,所述方法包括:按照列存数据库物化需要的行号索引进行排序,将排序后的数据进行物化;将物化的数据根据物化序号排序,按照所述行号索引对数据进行物化。通过将乱序的行号索引排序,提前将该维度数据物化,以避免频繁的重复I/O。然后通过高效的排序算法将物化的数据调整顺序,使原来的维度可以顺序物化。最后将原来的乱序行号索引换成顺序的索引,基于新的数据物化。提高了join后物化的性能,减少了大量的重复I/O。
-
-