一种混合精度量化方法、装置、介质及设备
摘要:
在本说明书提供一种混合精度量化方法、装置、介质及设备,通过确定深度神经网络模型中的各层的量化位宽,对深度神经网络模型进行量化,确定候选量化模型,并将样本分别输入深度神经网络模型以及候选量化模型,确定候选量化模型的量化误差、加速比以及压缩效果,进而确定候选量化模型的适应度,最后,根据预设的进化算法以及候选量化模型的适应度,确定深度神经网络模型的目标量化模型,使得混合精度量化方法能够根据少量无标签样本确定深度神经网络模型的目标量化模型,提高了混合精度量化方法的泛用性。
公开/授权文献
0/0