发明公开
- 专利标题: 端到端的深度神经网络模型压缩及异构转换系统及方法
-
申请号: CN202211292482.3申请日: 2022-10-21
-
公开(公告)号: CN115759237A公开(公告)日: 2023-03-07
- 发明人: 王旭强 , 江黛茹 , 张倩宜 , 郑剑 , 金尧 , 杨一帆 , 郑阳
- 申请人: 国网天津市电力公司 , 国家电网有限公司 , 国网天津市电力公司信息通信公司
- 申请人地址: 天津市河北区五经路39号; ;
- 专利权人: 国网天津市电力公司,国家电网有限公司,国网天津市电力公司信息通信公司
- 当前专利权人: 国网天津市电力公司,国家电网有限公司,国网天津市电力公司信息通信公司
- 当前专利权人地址: 天津市河北区五经路39号; ;
- 代理机构: 天津盛理知识产权代理有限公司
- 代理商 王来佳
- 主分类号: G06N3/082
- IPC分类号: G06N3/082 ; G06N3/0464 ; G06N3/048 ; G06N3/047 ; G06N3/063
摘要:
本发明涉及一种端到端的深度神经网络模型压缩及异构转换系统及方法,包括:面向边缘侧设备的深度神经网络模型压缩模块,用于实现对待优化网络模型的剪枝,并根据网络特征对网络模型进行重训练,继而使用多种模型量化压缩方法得到较小精度损失的压缩网络模型后,将压缩后网络模型输入至面向边缘侧设备的异构模型转换模块;面向边缘侧设备的异构模型转换模块,用于实现网络模型由X86到ARM的转换,实现网络模型异构转换的自动化。本发明能够解决电力边缘测设备无法与通用的服务器端架构兼容,导致现有的深度神经网络模块无法直接应用在电力边缘侧设备中或者无法提供足够的性能,从而制约了边缘侧深度神经网络技术的应用的问题。