一种用于加速云平台数据库LSM树查询的高效过滤方法

    公开(公告)号:CN115292308A

    公开(公告)日:2022-11-04

    申请号:CN202210790603.0

    申请日:2022-07-05

    Applicant: 南京大学

    Abstract: 本发明公开了一种用于加速云平台数据库LSM树查询的高效过滤方法,包括如下步骤:将已写入的数据按自身特点划分至互相独立的数据集子块内,为每一个数据集子块单独构建缓存行大小的分块布隆过滤器;结合在本数据块内缺失,但是历史查询频繁的数据,自适应调整已写入的数据的哈希函数集并存入分块哈希表达器;将分块布隆过滤器以及分块哈希映射表共同构成分块哈希自适应过滤器,并部署到系统中。在进行数据是否写入的判断时,采用单指令多数据流技术同时检测一个块内多个比特位。本发明将过滤器按缓存行大小进行分块,并行检测分块内的比特数据,极大提升了查询效率,并结合哈希自适应技术,有效避免了分块带来的准确性降低问题。

Patent Agency Ranking