一种适用于堆叠式沙漏网络的深度学习加速器
摘要:
本发明公开了一种适用于堆叠式沙漏网络的深度学习加速器,并行计算的层计算单元提高了计算并行度,数据缓存模块在加快计算速度的同时提高了载入到加速器内部缓存的数据的利用率;同时加速器内部的数据调整器可以根据计算层操作的不同能够进行自适应的数据排布顺序的变化,能够增加获取数据的完整性,提高数据获取的效率,减少访存过程的延时。因此,本加速器在提高算法计算速度的同时通过减少内存访问次数及提高访存效率来有效地降低了内存带宽,从而实现加速器整体的计算加速性能。
公开/授权文献
0/0