一种卷积神经网络的压缩方法、装置及电子设备

    公开(公告)号:CN112308197A

    公开(公告)日:2021-02-02

    申请号:CN201910680935.1

    申请日:2019-07-26

    Abstract: 本发明实施例提供了一种卷积神经网络的压缩方法、装置及电子设备。针对每一卷积层,该方法包括:将该卷积层的权值张量变形为第一二维矩阵;确定第一二维矩阵的多个第一奇异值分解项;按照第一选取规则,从多个第一奇异值分解项中,选取至少一个第一奇异值分解项;利用各个第一奇异值分解项,对第一二维矩阵进行近似分解,得到第一分解矩阵和第二分解矩阵;将第一分解矩阵和第二分解矩阵分别变形为第一子权值张量和第二子权值张量,作为压缩后的权值张量;在得到目标卷积神经网络每一层卷积层压缩后的权值张量后,得到被压缩的目标卷积神经网络。与现有技术相比,应用本发明实施例提供的方案,可以降低关于压缩前后的卷积神经网络间的精准度差异。

    一种卷积神经网络的压缩方法、装置及电子设备

    公开(公告)号:CN112308197B

    公开(公告)日:2024-04-09

    申请号:CN201910680935.1

    申请日:2019-07-26

    Abstract: 本发明实施例提供了一种卷积神经网络的压缩方法、装置及电子设备。针对每一卷积层,该方法包括:将该卷积层的权值张量变形为第一二维矩阵;确定第一二维矩阵的多个第一奇异值分解项;按照第一选取规则,从多个第一奇异值分解项中,选取至少一个第一奇异值分解项;利用各个第一奇异值分解项,对第一二维矩阵进行近似分解,得到第一分解矩阵和第二分解矩阵;将第一分解矩阵和第二分解矩阵分别变形为第一子权值张量和第二子权值张量,作为压缩后的权值张量;在得到目标卷积神经网络每一层卷积层压缩后的权值张量后,得到被压缩的目标卷积神经网络。与现有技术相比,应用本发明实施例提供的方案,可以降低关于压缩前后的卷积神经网络间的精准度差异。

Patent Agency Ranking