一种模型压缩方法、装置、电子设备及可读存储介质

    公开(公告)号:CN112329923B

    公开(公告)日:2024-05-28

    申请号:CN202011334592.2

    申请日:2020-11-24

    Abstract: 本申请提供一种模型压缩方法、装置、电子设备及可读存储介质,该模型压缩方法包括:将待压缩模型划分为多个优化单元,其中,一个优化单元包括所述待压缩模型中连续的多个卷积层;对于任一优化单元,对该优化单元中各卷积层的参数进行量化,得到量化后的优化单元;分别对所述量化后的优化单元中各卷积层的参数进行优化,以使第一距离小于第二距离。该方法可以在保证模型性能和模型压缩效果的情况下,减少模型压缩消耗的时间和计算、存储资源。

    一种模型压缩方法、装置、电子设备及可读存储介质

    公开(公告)号:CN112329923A

    公开(公告)日:2021-02-05

    申请号:CN202011334592.2

    申请日:2020-11-24

    Abstract: 本申请提供一种模型压缩方法、装置、电子设备及可读存储介质,该模型压缩方法包括:将待压缩模型划分为多个优化单元,其中,一个优化单元包括所述待压缩模型中连续的多个卷积层;对于任一优化单元,对该优化单元中各卷积层的参数进行量化,得到量化后的优化单元;分别对所述量化后的优化单元中各卷积层的参数进行优化,以使第一距离小于第二距离。该方法可以在保证模型性能和模型压缩效果的情况下,减少模型压缩消耗的时间和计算、存储资源。

Patent Agency Ranking