面向边缘设备的深度学习编程框架评估优化方法及系统

    公开(公告)号:CN116451779A

    公开(公告)日:2023-07-18

    申请号:CN202310249244.2

    申请日:2023-03-15

    Abstract: 本发明提出一种面向边缘设备的深度学习编程框架评估优化方法,包括:解析深度学习任务的配置文件,获得深度学习任务的程序控制信息;依据该程序控制信息,依次获取边缘设备执行该深度学习任务的多个实际运行数据;该实际运行数据包括该边缘设备运行该深度学习任务时的GPU实际峰值浮点运算数据、GPU实际各层级内存峰值带宽数据、浮点运算数量、GPU内核活动时间和GPU数据移动量;以该实际运行数据绘制该边缘设备运行该深度学习任务的运行时分层屋顶线图;根据该运行时分层屋顶线图,确定对该深度学习任务的优化方向及优化顺序。本发明还提出一种面向边缘设备的深度学习编程框架评估优化系统,以及一种用于深度学习编程框架评估优化的数据处理装置。

Patent Agency Ranking