-
公开(公告)号:CN102591947A
公开(公告)日:2012-07-18
申请号:CN201110445284.1
申请日:2011-12-27
Applicant: 微软公司
IPC: G06F17/30
CPC classification number: G06F12/0862 , G06F12/0866 , G06F12/0897 , G06F17/30097 , G06F17/30159 , G06F2212/1024 , G06F2212/463 , G06F2212/466
Abstract: 本发明公开了用于数据去重复的快速且低RAM占用的索引。本发明涉及数据去重复技术,其中散列索引服务的索引在诸如硬盘驱动器之类的辅助存储设备中维护散列索引,以及在RAM中维护用于在去重复操作期间减少访问辅助存储设备的I/O的紧凑索引表和前瞻高速缓存。还描述了用于在去重复会话期间维护数据的会话高速缓存,以及出于效率考虑对只读紧凑索引表进行的编码。