端到端的深度神经网络模型压缩及异构转换系统及方法
摘要:
本发明涉及一种端到端的深度神经网络模型压缩及异构转换系统及方法,包括:面向边缘侧设备的深度神经网络模型压缩模块,用于实现对待优化网络模型的剪枝,并根据网络特征对网络模型进行重训练,继而使用多种模型量化压缩方法得到较小精度损失的压缩网络模型后,将压缩后网络模型输入至面向边缘侧设备的异构模型转换模块;面向边缘侧设备的异构模型转换模块,用于实现网络模型由X86到ARM的转换,实现网络模型异构转换的自动化。本发明能够解决电力边缘测设备无法与通用的服务器端架构兼容,导致现有的深度神经网络模块无法直接应用在电力边缘侧设备中或者无法提供足够的性能,从而制约了边缘侧深度神经网络技术的应用的问题。
0/0