发明授权
- 专利标题: 一种混合精度量化方法、装置、介质及设备
-
申请号: CN202411153835.0申请日: 2024-08-21
-
公开(公告)号: CN118673959B公开(公告)日: 2024-10-22
- 发明人: 袁勇 , 施航 , 任祖杰 , 缪锐 , 朱琦 , 孙沁璇 , 刘洋 , 彭风光 , 庞心健
- 申请人: 之江实验室
- 申请人地址: 浙江省杭州市余杭区中泰街道科创大道之江实验室
- 专利权人: 之江实验室
- 当前专利权人: 之江实验室
- 当前专利权人地址: 浙江省杭州市余杭区中泰街道科创大道之江实验室
- 代理机构: 北京博思佳知识产权代理有限公司
- 代理商 邓超
- 主分类号: G06N3/04
- IPC分类号: G06N3/04 ; G06N3/086 ; G06V10/764 ; G06V10/82
摘要:
在本说明书提供一种混合精度量化方法、装置、介质及设备,通过确定深度神经网络模型中的各层的量化位宽,对深度神经网络模型进行量化,确定候选量化模型,并将样本分别输入深度神经网络模型以及候选量化模型,确定候选量化模型的量化误差、加速比以及压缩效果,进而确定候选量化模型的适应度,最后,根据预设的进化算法以及候选量化模型的适应度,确定深度神经网络模型的目标量化模型,使得混合精度量化方法能够根据少量无标签样本确定深度神经网络模型的目标量化模型,提高了混合精度量化方法的泛用性。
公开/授权文献
- CN118673959A 一种混合精度量化方法、装置、介质及设备 公开/授权日:2024-09-20