一种基于通道剪枝和量化训练的联合神经网络模型压缩方法

    公开(公告)号:CN111652366A

    公开(公告)日:2020-09-11

    申请号:CN202010388100.1

    申请日:2020-05-09

    Abstract: 本发明公开了一种基于通道剪枝和量化训练的联合神经网络模型压缩方法。步骤1:稀疏化训练模型;步骤2:训练模型剪枝;步骤3:模型微调;步骤4:对剪枝结束后的模型进行量化,构建常规浮点数计算图;步骤5:在计算图中卷积计算的相应位置插入伪量化模块,在卷积权重处和激活值处插入两个伪量化模块,将权重和激活值量化为8位整型;步骤6:动态量化训练模型直至收敛;步骤7:量化推理;步骤8:最后得到剪枝与量化后的模型。本发明通过剪枝和量化两种技术,在保持模型准确率的情况下,极大地降低模型时间和空间上的消耗。

Patent Agency Ranking