一种深度可分离卷积神经网络加速方法和加速器
摘要:
本发明提供一种深度可分离卷积神经网络加速方法,包括:对输入神经元进行深度卷积,在进行所述深度卷积计算时,C输入通道的同M行在三维处理单元PE阵列里独立并行计算,得到C通道的同N行输出神经元,N
0/0