-
公开(公告)号:CN119513375A
公开(公告)日:2025-02-25
申请号:CN202411664669.0
申请日:2024-11-20
Applicant: 南京大学
IPC: G06F16/903 , G06F16/906 , G06F16/901 , G06F18/22
Abstract: 本发明提供了一种基于近似最近邻搜索的向量检索装置,包含第一存储、第二存储、第三存储、第四存储、大聚类计算LCM模块、量化查找表计算QPM模块,以及最终量化相似度计算和结果计算DCM模块;本装置可以连接HBM、DDR等存储器,而不是仅能够采用FPGA的BRAM片上存储来存储所有数据,可以应用于更多更复杂的场景;本装置采用了更高效的大聚类中心计算和量化查找表计算的并行策略,以及更高速的Top‑k计算模块,速度更快、功耗更低。