-
公开(公告)号:CN111488051A
公开(公告)日:2020-08-04
申请号:CN202010153250.4
申请日:2020-03-06
Applicant: 复旦大学
IPC: G06F1/3287 , G06F9/50 , G06N3/08
Abstract: 本发明属于计算机体系结构设计技术领域,具体为一种基于CPU和FPGA协同计算的云端深度神经网络优化方法。该方法实现分为前端和后端两部分;前端是CPU为核心的服务器端,负责流程控制、数据接收和部分处理;后端是以FPGA为核心的加速部件,包括大规模并行处理器阵列、图形处理单元、专用集成电路以及PCI-E接口,负责深度神经网络关键层的并行加速处理等。先将深度神经网络按不同层次划分为分别适合前端和后端处理的两个部分。前端将接收到的数据以数据流的形式,由DDR穿梭于前后端之间处理各个层或组合层。前端灵活的流程控制配合后端高效的并行结构,可大幅提高神经网络计算的能效比。