针对动态图快照的CPU-GPU异构并发图处理方法及系统

    公开(公告)号:CN117971485A

    公开(公告)日:2024-05-03

    申请号:CN202410161999.1

    申请日:2024-02-04

    Abstract: 本发明提出一种针对动态图快照的CPU‑GPU异构并发图处理方法和系统,包括:提取所有图快照的公共子图和每个图快照对应变化的子图,从而形成子图Gs和Gc;将公共子图Gs,依据GPU显存大小和顶点度的属性信息,划分为两部分,分别为Gs0和Gs1,之后将Gs0在初始时一次性拷贝到GPU显存中,Gs1则在迭代处理过程中,按需进行数据重组后,然后以异步多流的方式拷贝到GPU显存中;基于GPU和CPU的计算资源,图处理过程中以顶点为中心,同步迭代方式执行图处理算法。

    一种基于GPU的稀疏深度神经网络的推理加速方法

    公开(公告)号:CN117592524A

    公开(公告)日:2024-02-23

    申请号:CN202311359769.8

    申请日:2023-10-19

    Abstract: 本发明提供一种基于GPU的稀疏深度神经网络的推理加速方法,用于加速所述稀疏深度神经网络对待处理数据的推理过程,所述GPU包括全局内存,所述稀疏深度神经网络包括多层网络层,所述全局内存中存储来自CPU传输的所述稀疏深度神经网络的网络层权重参数,所述方法包括:S1、基于所述全局内存大小、所述待处理数据整体所需内存大小和单层网络层权重参数所需大小,按照预设的分块规则对所述待处理数据进行分块处理得到分块数据,以使每个分块数据均能被完整的存储于全局内存中;S2、将每个分块数据与所述全局内存中存储的网络层权重参数进行计算,直至每个分块数据与所述稀疏深度神经网络的每一网络层权重参数完成计算。

Patent Agency Ranking