-
公开(公告)号:CN118642658A
公开(公告)日:2024-09-13
申请号:CN202410859077.8
申请日:2024-06-28
Applicant: 上海交通大学
IPC: G06F3/06 , H04L67/1097
Abstract: 本发明提供了一种适用于簇索引的基于远端内存的分组存储方法及系统,包括:步骤S1:采用簇访问感知的向量分组技术存储向量,完成分组后启动系统服务;步骤S2:系统读簇时通过一次I/O请求读取簇的分组内向量数据和分组外向量地址,再发起多个独立的I/O请求读取所有的分组外向量。本发明的方法不破坏算法语义,保证向量搜索算法读到的向量和原本的实现一致,所以不同的聚类算法能很容易使用本发明优化实现;本发明遵循解耦合存储思想,通过存地址代替存数据降低了向量索引的存储压力。
-
公开(公告)号:CN118916525A
公开(公告)日:2024-11-08
申请号:CN202410982368.6
申请日:2024-07-22
Applicant: 上海交通大学
IPC: G06F16/903 , G06F16/901
Abstract: 本发明提供了一种适用于图索引的计算传输流水线并行方法及系统,包括:步骤S1:从当前候选点出发,基于内存中的压缩向量计算当前候选点邻居与目标向量的近似距离,更新近似候选集;步骤S2:检查近似候选集,当近似候选集中所有点均已被访问或总访问计数超过最大访问限制,结束查询,返回真实候选集;否则,选择近似候选集中第一个未访问的候选点作为下一个候选点,发送异步I/O请求读取下一个候选点对应的完整向量与邻边,并将该候选点标记为已访问;在等待IO完成的同时,计算当前候选点与目标向量的真实距离,更新真实候选集;步骤S3:收到I/O完成通知,保留下一个候选点的完整向量;基于下一个候选点更新当前候选点,重复触发步骤S1至步骤S3。
-