一种基于BNRP的可配置并行通用卷积神经网络加速器

    公开(公告)号:CN110390385A

    公开(公告)日:2019-10-29

    申请号:CN201910572582.3

    申请日:2019-06-28

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于BNRP的可配置并行通用卷积神经网络加速器,属于计算、推算、计数的技术领域。加速器包含:模式配置器、卷积计算器、BNRP计算器、数据通信单元、数据压缩编码/解码器。卷积计算器包含T个大小为R*C的脉动卷积阵列,每个脉动卷积阵列配置相应的输入、输出特征图缓存区、配置信息数据缓存区。BNRP计算器可执行两种计算模式,包含:R*T个数据输入和输出接口、R*T个池化器、归一化计算模块和非线性激活计算模块,各功能模块按流水线方式并行执行。本发明能够根据各种网络结构的特点,动态配置并行加速计算模块执行模式.且通用性好,对网络结构层复杂且规模相对较大的卷积神经网络,可极大地降低计算复杂度,功耗低、吞吐量高。

    一种可配置的通用卷积神经网络加速器

    公开(公告)号:CN110390384A

    公开(公告)日:2019-10-29

    申请号:CN201910554533.7

    申请日:2019-06-25

    Applicant: 东南大学

    Abstract: 本发明公开了一种可配置的通用卷积神经网络加速器,属于计算、推算、计数的技术领域。该加速器包括:PE阵列、状态控制器、功能模块、权重缓存区、特征图缓存区、输出缓存区和寄存器栈,状态控制器包括网络参数寄存器和工作状态控制器。通过配置网络参数寄存器对不同规模的网络均能取得优异的加速效果,工作状态控制器控制着加速器工作状态的切换并将控制信号发送至其它模块。权重缓存区、特征图缓存区和输出缓存区均由多个数据子缓存区构成,用于分别存放权重数据、特征图数据和计算结果。本发明能够针对不同的网络特点,配置合适的数据重用模式、阵列尺寸和子缓存区个数,通用性好,功耗低,吞吐量高。

Patent Agency Ranking