基于图信号处理的用于加速神经网络推理的方法

    公开(公告)号:CN112801294A

    公开(公告)日:2021-05-14

    申请号:CN202110360221.X

    申请日:2021-04-02

    Applicant: 福州大学

    Inventor: 钱慧 林玮臻

    Abstract: 本发明提出一种基于图信号处理的用于加速神经网络推理的方法,其特征在于:通过提取原始神经网络模型的权重参数,将神经网络中全连接层及卷积层的计算过程转换为图移或图滤波的方式,以执行并行计算。其主要面向GPU微体系结构的特点,针对神经网络训练推理过程中的计算具有多种并行特征,利用图信号处理相关技术将原始的串行直接卷积计算过程转换矩阵‑向量乘或矩阵‑矩阵乘的计算方式,充分开发和利用了GPU强大的并行计算能力,使推理计算过程得到加速。同时,经转换后,每一层网络的计算形式都变成了矩阵‑向量乘或矩阵‑矩阵乘,使整个网络推理过程中的计算形式统一化,有利于利用层间融合技术,进一步加速推理过程。

    基于图信号处理的用于加速神经网络推理的方法

    公开(公告)号:CN112801294B

    公开(公告)日:2022-10-04

    申请号:CN202110360221.X

    申请日:2021-04-02

    Applicant: 福州大学

    Inventor: 钱慧 林玮臻

    Abstract: 本发明提出一种基于图信号处理的用于加速神经网络推理的方法,其特征在于:通过提取原始神经网络模型的权重参数,将神经网络中全连接层及卷积层的计算过程转换为图移或图滤波的方式,以执行并行计算。其主要面向GPU微体系结构的特点,针对神经网络训练推理过程中的计算具有多种并行特征,利用图信号处理相关技术将原始的串行直接卷积计算过程转换矩阵‑向量乘或矩阵‑矩阵乘的计算方式,充分开发和利用了GPU强大的并行计算能力,使推理计算过程得到加速。同时,经转换后,每一层网络的计算形式都变成了矩阵‑向量乘或矩阵‑矩阵乘,使整个网络推理过程中的计算形式统一化,有利于利用层间融合技术,进一步加速推理过程。

Patent Agency Ranking