-
公开(公告)号:CN116257523A
公开(公告)日:2023-06-13
申请号:CN202310096644.4
申请日:2023-02-10
Applicant: 中国科学院信息工程研究所
IPC: G06F16/22 , G06F16/23 , G06F16/2458 , G06F3/06
Abstract: 本发明公开一种基于非易失存储器的列式存储索引方法及装置,涉及计算机领域,本发明针对指标列实时更新,通过在NVM中建立缓存池,利用NVM的特点,通过两阶段批量更新,构建Main和Delta结构,Main包括多个Segment,每个Segment包含元数据信息和数据信息;Delta包括两个Delta文件,更新时进行交替;在内存中为Delta文件构建Bloom Filter进行更新数据的查询和判断。针对指标列在传统段合并时造成严重写放大的问题,本发明在创建索引时用元数据信息合并来替代传统的列存索引合并,从而在保证读写性能不下降的情况下,减少内存空间的占用以及读写放大。针对低基数维度列,对其创建倒排索引,大幅减少内存空间占用并提升等值查询性能。