一种模型压缩方法、系统及存储介质

    公开(公告)号:CN116776954A

    公开(公告)日:2023-09-19

    申请号:CN202310716586.0

    申请日:2023-06-15

    IPC分类号: G06N3/082 G06N3/08

    摘要: 本申请公开一种模型压缩方法、系统及存储介质,涉及模型压缩技术领域,能够提高模型压缩效率。具体方案包括:服务器接收客户端发送的可执行文件,可执行文件中包括:接口文件、调用文件、待压缩模型和待压缩模型的运行环境程序;接口文件用于获取训练数据集、验证数据集、损失函数和优化器;调用文件用于调用目标压缩程序;服务器确定待压缩模型的初始模型精度;服务器利用调用文件获取目标压缩程序,并利用目标压缩程序、损失函数和优化器对待压缩程序进行压缩,得到压缩模型;服务器确定压缩模型的压缩模型精度,若初始模型精度和压缩模型精度的精度差的绝对值小于预设阈值,则得到待压缩模型的目标压缩模型,并将目标压缩模型发送至客户端。