-
公开(公告)号:CN110390385B
公开(公告)日:2021-09-28
申请号:CN201910572582.3
申请日:2019-06-28
Applicant: 东南大学
Abstract: 本发明公开了一种基于BNRP的可配置并行通用卷积神经网络加速器,属于计算、推算、计数的技术领域。加速器包含:模式配置器、卷积计算器、BNRP计算器、数据通信单元、数据压缩编码/解码器。卷积计算器包含T个大小为R*C的脉动卷积阵列,每个脉动卷积阵列配置相应的输入、输出特征图缓存区、配置信息数据缓存区。BNRP计算器可执行两种计算模式,包含:R*T个数据输入和输出接口、R*T个池化器、归一化计算模块和非线性激活计算模块,各功能模块按流水线方式并行执行。本发明能够根据各种网络结构的特点,动态配置并行加速计算模块执行模式.且通用性好,对网络结构层复杂且规模相对较大的卷积神经网络,可极大地降低计算复杂度,功耗低、吞吐量高。
-
公开(公告)号:CN113313252A
公开(公告)日:2021-08-27
申请号:CN202110562786.6
申请日:2021-05-24
Applicant: 东南大学
Abstract: 本发明公开了一种基于脉动阵列的深度可分离卷积实现方法,采用M行N列个处理单元(Processing Element,PE单元)构成脉动阵列结构:在水平方向上,相邻的PE单元之间相互连接,左侧的PE单元可以将数据传递给右侧的PE单元;在垂直方向上,每个PE单元有各自的数据输入端口和数据输出端口。数据预取模块为计算阵列提供特征图数据和权重参数。加法树对每一列PE单元并行输出的部分和数据进行累加。每个PE单元内部主要由寄存器、数据选择器、加法器和乘法器构成。本发明采用上述结构的脉动阵列并配合数据预取模块和加法树,可以实现不同的数据流和数据重用方式,从而实现对标准卷积、点卷积和深度卷积的加速计算。
-
公开(公告)号:CN112786021A
公开(公告)日:2021-05-11
申请号:CN202110101761.6
申请日:2021-01-26
Applicant: 东南大学
Abstract: 本发明公开了一种基于分层量化的轻量级神经网络语音关键词识别方法,属于计算、推理、计数的技术领域。该系统包括:语音采集模块、特征提取模块、轻量级神网络加速器以及分层8bits量化模块等。轻量级神经网络采用深度可分离卷积神经网络和注意力机制Squeeze‑and‑Excitation,通过将传统卷积替换成深度可分离卷积,降低神经网络的参数量和计算量,通过引入注意力机制,标注卷积过程中不同通道上特征的重要程度,提高模型的识别准确率,通过对神经网络的权重值量化和激活值分层8bits量化,进一步降低模型的计算复杂度和神经网络的参数量,通过设计支持通道分离卷积和传统卷积的加速器,满足对数据带宽的不同需求,从而加速前向推理计算的过程。
-
公开(公告)号:CN110390385A
公开(公告)日:2019-10-29
申请号:CN201910572582.3
申请日:2019-06-28
Applicant: 东南大学
Abstract: 本发明公开了一种基于BNRP的可配置并行通用卷积神经网络加速器,属于计算、推算、计数的技术领域。加速器包含:模式配置器、卷积计算器、BNRP计算器、数据通信单元、数据压缩编码/解码器。卷积计算器包含T个大小为R*C的脉动卷积阵列,每个脉动卷积阵列配置相应的输入、输出特征图缓存区、配置信息数据缓存区。BNRP计算器可执行两种计算模式,包含:R*T个数据输入和输出接口、R*T个池化器、归一化计算模块和非线性激活计算模块,各功能模块按流水线方式并行执行。本发明能够根据各种网络结构的特点,动态配置并行加速计算模块执行模式.且通用性好,对网络结构层复杂且规模相对较大的卷积神经网络,可极大地降低计算复杂度,功耗低、吞吐量高。
-
公开(公告)号:CN110390383A
公开(公告)日:2019-10-29
申请号:CN201910554531.8
申请日:2019-06-25
Applicant: 东南大学
Abstract: 本发明公开了一种基于幂指数量化的深度神经网络硬件加速器,涉及深度神经网络卷积计算硬件加速的处理器结构,属于计算、推算、计数的技术领域。硬件加速器包括:AXI-4总线接口、输入缓存区、输出缓存区、权重缓存区、权重索引缓存区、编码模块、可配置状态控制器模块、PE阵列。输入缓存区和输出缓存区设计成行缓存结构;编码器依据有序量化集对权重编码,该量化集存放所有权重量化后的绝对值可能取值。加速器计算时,PE单元从输入缓存区、权重索引缓存区读取数据进行移位计算,将计算结果送至输出缓存区。本发明用移位运算代替浮点乘法运算,降低了对计算资源、存储资源以及通信带宽的要求,进而提高了加速器计算效率。
-
公开(公告)号:CN109325398A
公开(公告)日:2019-02-12
申请号:CN201810702472.X
申请日:2018-06-30
Applicant: 东南大学
Abstract: 本发明公开了一种基于迁移学习的人脸属性分析方法,属于计算推算的技术领域,尤其涉及识别人脸属性的计算机视觉技术领域。本发明在多属性预测网络上联合训练样本集以预测特征属性,将收敛的多属性预测网络迁移到主属性预测网络,继续训练主属性预测网络并微调参数直至主属性预测网络的损失函数收敛,所述主属性包含但不限于基于逻辑回归的人脸属性以及基于线性回归的人脸属性的主属性,既防止了局部极小,又避免了任务过于复杂导致的精度降低,在实际应用中更加精确灵活。
-
-
-
-
-