一种深度神经网络模型的压缩方法及相关系统

    公开(公告)号:CN118886462A

    公开(公告)日:2024-11-01

    申请号:CN202410916279.1

    申请日:2024-07-09

    Abstract: 本发明属于数据网络模型领域,公开了一种深度神经网络模型的压缩方法及相关系统,本发明剪枝通过去除不重要的权值,减少了模型的参数数量。这不仅简化了模型结构,还降低了计算复杂度和内存需求。剪枝后的模型需要较少的计算资源,特别是在推理(inference)阶段,这对于在资源受限的设备(如移动设备和嵌入式系统)上运行非常重要。本发明减少了冗余的计算,剪枝后的模型可以加速训练和推理过程,提高整体运行速度。本发明的剪枝可以起到正则化的效果,减少过拟合的风险,使模型在处理未见过的数据时表现更好。本发明的剪枝可以显著降低模型的存储需求和能耗,对于部署在大规模服务或云计算环境中,可以节约大量的资源。

Patent Agency Ranking