模型训练方法、装置及计算机存储介质

    公开(公告)号:CN119646500A

    公开(公告)日:2025-03-18

    申请号:CN202311196358.1

    申请日:2023-09-15

    Abstract: 本申请提供了模型训练方法、装置及计算机存储介质。方法包括获取预训练好的模型;预训练好的模型包括第一模型参数的第一参数值(通过第一比特宽度存储);对预训练好的模型进行量化,得到量化模型;量化模型包括第一模型参数的第二参数值(通过小于第一比特宽度的第二比特宽度存储)和量化参数,第二参数值为通过量化尺度(共享量化参数的参数值数目)对第一参数值量化得到;将样本作为量化模型的输入,基于量化尺度对样本进行聚合后的结果作为目标模型的输入,基于量化模型和目标模型的输出进行标签预测的预测结果、样本的标签训练目标模型;基于训练好的目标模型修正量化参数。修正后的量化模型可以直接进行低比特推理,可以提高部署效率。

Patent Agency Ranking