-
公开(公告)号:CN116560672A
公开(公告)日:2023-08-08
申请号:CN202310608632.5
申请日:2023-05-26
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请实施例提供了一种模型部署方法、装置、电子设备及存储介质,电子设备获取目标平台对应的业务样本;根据预设裁剪率及预设对齐参数,剪裁待裁剪模型的通道;获取剪裁后的模型在目标平台运行的耗时以及精度;基于耗时与精度水平,确定剪裁损失;根据剪裁损失更新预设裁剪率以及预设对齐参数;返回剪裁待裁剪模型的通道,直到更新前后预设裁剪率相同;基于目标对齐参数和目标裁剪率裁剪待裁剪模型;将目标模型部署至目标平台。由于剪裁损失根据耗时差异和精度差异确定,反映模型剪裁前后耗时精度变化,根据剪裁损失更新预设裁剪率和预设对齐参数,在保证模型精度的前提下减少模型在目标平台运行的耗时,提高模型部署至平台后的运行速度和精度。