基于查询频繁项划分空间数据的多维学习索引构建方法

    公开(公告)号:CN115658685A

    公开(公告)日:2023-01-31

    申请号:CN202211187508.8

    申请日:2022-09-28

    Applicant: 东北大学

    Abstract: 本发明提供了基于查询频繁项划分空间数据的多维学习索引构建方法,属于学习索引技术领域。该方法对历史查询数据流中Top‑k查询频繁项进行挖掘并按各网格内估计查询频数均匀划分网格,各网格被查询读取的概率基本相近,所以当某网格内拥有查询频繁项多时,该网格内总数据点数就更少,从而在读取该网格所在磁盘页面时,遍历的数据点就少,进而提高了查询倾斜工作负载下空间数据的查询速度;设计合理的映射函数确保位于小编号单元网格中的点的映射值比位于大编号单元网格中的点的映射值小,对不易排序的多维数据依照网格编号赋予单调递增的映射值。从而在处理查询问题时,可轻松获取需要读取的单元网格,减少对查询范围以外网格的读取,提升查询速度。

Patent Agency Ranking