轻量级网络的量化方法、计算设备及计算机存储介质

    公开(公告)号:CN119990192A

    公开(公告)日:2025-05-13

    申请号:CN202510061427.0

    申请日:2025-01-15

    Inventor: 刘毅 宋阳 李吉星

    Abstract: 本申请实施例提供一种轻量级网络的量化方法、计算设备及计算机存储介质。其中,轻量级网络的量化方法包括:构建第一网络块的初始化均衡化向量、初始化偏差吸收向量以及初始化量化系数;对第一网络块进行量化,得到第一量化网络块;基于第一输出数据和第二输出数据构建网络误差,基于第三输出数据和第四输出数据构建分块重建误差;以最小化分块重建误差和网络误差为优化目标,对第一网络块的初始化均衡化向量、初始化偏差吸收向量以及初始化量化系数进行优化,生成目标均衡化向量、目标偏差吸收向量以及目标量化系数,并得到量化完成的第二量化网络块。本申请实施例提供的技术方案能够提高轻量级网络的量化精度。

Patent Agency Ranking