-
公开(公告)号:CN119721164A
公开(公告)日:2025-03-28
申请号:CN202311254439.2
申请日:2023-09-26
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06N3/082 , G06N3/0464
Abstract: 本申请公开了一种模型量化方法,包括:确定待量化的神经网络模型中待量化层的待量化参数的浮点值集合,所述待量化参数的浮点值集合包括多个待量化参数浮点值;根据所述待量化参数的截断值确定补充浮点值集合和初始浮点值集合;在目标部署平台所对应的输出通道的范围内拼接所述补充浮点值集合和所述初始浮点值集合,得到目标浮点值集合;对所述目标浮点值集合进行量化,得到目标量化值集合。本申请还提供一种电子设备和一种计算机可读介质。
-
公开(公告)号:CN119670834A
公开(公告)日:2025-03-21
申请号:CN202311226850.9
申请日:2023-09-21
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请涉及计算机技术领域,公开了一种模型量化方法、设备、存储介质及装置,该方法包括:将待量化神经网络模型中多层权重的量化步长解耦为权重反量化步长,权重反量化步长用于将整数权重转回浮点权重,对待量化神经网络模型进行伪量化,基于校准数据集推理待量化神经网络模型伪量化前后的量化误差,根据量化误差对权重反量化步长进行更新,获得量化后神经网络模型,根据量化后神经网络模型的量化参数将量化后神经网络模型部署至目标部署平台;由于本申请将权重的量化步长解耦为权重反量化步长,权重反量化步长可以参与优化更新,从而能够减小量化误差损失,进而能够提高量化性能,提高模型量化精度。
-