用于GPU的图神经网络加速训练方法、存储介质及电子装置

    公开(公告)号:CN119417693A

    公开(公告)日:2025-02-11

    申请号:CN202411476492.1

    申请日:2024-10-22

    Abstract: 本申请公开了一种用于GPU的图神经网络加速训练方法、存储介质及电子装置,所述方法包括:获取初始图,并将初始图分割为N个子图,其中初始图为动态图样本中对应一个时刻的静态图;预估子图的计算负荷,基于子图的计算负荷将N个子图分配至M个GPU上并进行图神经网络的训练,其中每个GPU上至少被分配2个子图;获取增量数据,并基于增量数据对子图进行更新,其中所述增量数据用于表征当前时刻扫描的动态图样本中的静态图相对于GPU当前处理的静态图的变化;将所述N个含有增量数据的子图分配至M个GPU上并进行图神经网络的训练。本技术确保了计算与资源利用率提升,降低了训练耗时,提高了图神经网络在训练时的训练效率。

    稀疏矩阵存储方法及向量乘方法

    公开(公告)号:CN118484135B

    公开(公告)日:2025-04-11

    申请号:CN202410377055.8

    申请日:2024-03-29

    Abstract: 本申请公开了一种稀疏矩阵存储方法及向量乘方法。该方法包括:根据预先确定的长度与宽度,从稀疏矩阵中获得多个矩阵块;根据每个矩阵块中非零元素的数量,从多个矩阵块中获得多个储存类;对多个储存类中具有三个以下非零元素的第i个储存类,根据非零元素于稀疏矩阵中的行坐标及列坐标,获得第i个非零元素数组;根据非零元素于稀疏矩阵中的列坐标、行坐标,获得第i个储存类的行索引数组、第一列索引数组;根据非零元素于第i个非零元素数组中的坐标,获得第i个储存类的量索引数组;根据以上索引数组及非零元素数组,储存第i个储存类;对于多个储存类中具有三个或三个以上非零元素的第t个储存类,采用压缩稀疏行CSR格式,储存第t个储存类。

    稀疏矩阵存储方法及向量乘方法

    公开(公告)号:CN118484135A

    公开(公告)日:2024-08-13

    申请号:CN202410377055.8

    申请日:2024-03-29

    Abstract: 本申请公开了一种稀疏矩阵存储方法及向量乘方法。该方法包括:根据预先确定的长度与宽度,从稀疏矩阵中获得多个矩阵块;根据每个矩阵块中非零元素的数量,从多个矩阵块中获得多个储存类;对多个储存类中具有三个以下非零元素的第i个储存类,根据非零元素于稀疏矩阵中的行坐标及列坐标,获得第i个非零元素数组;根据非零元素于稀疏矩阵中的列坐标、行坐标,获得第i个储存类的行索引数组、第一列索引数组;根据非零元素于第i个非零元素数组中的坐标,获得第i个储存类的量索引数组;根据以上索引数组及非零元素数组,储存第i个储存类;对于多个储存类中具有三个或三个以上非零元素的第t个储存类,采用压缩稀疏行CSR格式,储存第t个储存类。

Patent Agency Ranking