一种基于图分割的深度学习推理加速方法

    公开(公告)号:CN115796265A

    公开(公告)日:2023-03-14

    申请号:CN202211629678.7

    申请日:2022-12-19

    Applicant: 南京大学

    Abstract: 本发明公开一种基于图分割的深度学习推理加速方法,该方法步骤包括:网络节点赋权、带权有向图分割、搜索任务生成、搜索调优、反馈调整搜索任务、生成加速方案,本方法针对现有深度学习推理加速方法在神经网络分割方案不合理以及搜索任务无法调整的缺陷,提出了使用带权有向图来模拟深度学习神经网络,并按照带权有向图无环分割算法来分割深度学习神经网络的方法,并且在搜索优化过程中根据搜索调优的中间结果对搜索任务进行反馈调整,对搜索任务进行一定程度的修正及调整,从而得到更高效的加速方案,取得更好的加速效果。

Patent Agency Ranking