一种基于FPGA的通用定点数神经网络卷积加速器硬件结构

    公开(公告)号:CN107392309A

    公开(公告)日:2017-11-24

    申请号:CN201710810528.9

    申请日:2017-09-11

    CPC classification number: G06N3/063 G06F5/06

    Abstract: 本发明公开了一种基于FPGA的通用定点数神经网络卷积加速器硬件结构,包括:通用AXI4高速总线接口,通用GPIO接口;提供通用的存储器硬件并且支持高并行的读写操作;通用卷积器可对定点数精度配置,可配置卷积操作大小,在完成数据存储后可配合高并行的读写进行高并行的卷积运算;通用读写控制单元,包含对ram、rom、Fifo的读写控制逻辑以及地址产生逻辑;通用状态控制器,针对卷积层和读写、计算过程做出相应的单元运行反应,控制整体的计算流程;通用卷积结果缓存器,采用对卷积结果分段式累加的方法,高速并行对处理结果进行缓存和向总线发送。本发明在基于Yolo算法的人脸检测和基于CNN的人脸识别应用中得到验证,体现出极高的运行速度和较高的数据精度。

    一种基于Adaboost算法的人脸检测方法

    公开(公告)号:CN110046565A

    公开(公告)日:2019-07-23

    申请号:CN201910279211.6

    申请日:2019-04-09

    Abstract: 本发明公开一种基于Adaboost算法的人脸检测方法,步骤是:对输入的视频或图像进行预处理,包括进行灰度归一化和滤波去噪;将彩色图像的RGB空间转换为YCbCr空间,然后根据肤色色度的范围,对图像进行肤色分割;对肤色分割后的图像进行形态学处理;采用Canny边缘检测算法对形态学处理后的图像进行边缘检测;利用RHT检测图像中的椭圆,将检测出似人脸的椭圆区域抠出,作为人脸候选区域;利用Adaboost算法训练级联分类器,利用训练好的级联分类器对人脸候选区域进行人脸检测,输出人脸位置。此种人脸检测方法能够在保证检测率的同时,降低计算量,提高检测速度。

    一种基于FPGA的二维FFT加速器

    公开(公告)号:CN109948113A

    公开(公告)日:2019-06-28

    申请号:CN201910159208.0

    申请日:2019-03-04

    Abstract: 本发明公开一种基于FPGA的二维FFT加速器,MCU与外部存储器相连接,用于读取外部存储器的输入数据,并将FFT计算结果发送给外部存储器;图片缓存区和旋转因子缓存区分别包含N个图片子缓存区和N个旋转因子子缓存区,用于缓存通过AXI4总线接口从MCU读取的图片和旋转因子数据;地址产生器用于产生图片缓存区的读取地址,按照该地址读取图片缓存区中的数据送入FFT计算器;FFT计算器采用FPGA实现,包含N个FFT计算子单元,每个计算子单元对应配置一个图片子缓存区和一个旋转因子子缓存区,每个计算子单元均用于完成复数乘法功能和四点FFT操作;结果缓存区用于缓存FFT计算器处理后的计算结果,然后通过AXI4总线接口发送至MCU。此种结构能够高效地进行图像的二维FFT。

    一种基于一维脉动阵列的通用卷积神经网络加速器

    公开(公告)号:CN109934339A

    公开(公告)日:2019-06-25

    申请号:CN201910168042.9

    申请日:2019-03-06

    Abstract: 本发明公开一种基于一维脉动阵列的通用卷积神经网络加速器,AXI4总线接口用于实现模式配置指令的载入以及待计算数据的读取与结果数据的批量发送;模式配置器通过模式配置指令配置各个功能模块为对应工作类型;数据调度模块可并发进行待计算数据缓存、计算数据读取、卷积结果缓存以及卷积结果处理与输出任务;卷积计算模块采用一维脉动阵列的模式进行卷积计算;待计算数据缓存区、卷积结果缓存区、输出结果缓冲FIFO,用于缓存对应数据;结果处理模块进行卷积神经网络中常见的结果处理操作。此种加速器能够兼容卷积神经网络中的不同计算类型并进行高并行度计算来有效加速,同时只需要较低的片外访存带宽需求以及少量的片上存储资源。

    一种基于ZYNQ的人脸关键点检测系统

    公开(公告)号:CN109034025A

    公开(公告)日:2018-12-18

    申请号:CN201810774764.4

    申请日:2018-07-16

    CPC classification number: G06K9/00228 G06K9/00268

    Abstract: 本发明公开一种基于ZYNQ的人脸关键点检测系统,包括摄像头、ZYNQ平台和VGA显示器,其中,ZYNQ平台集成有可编程逻辑模块和处理系统模块,处理系统模块中设有处理器和存储器;所述摄像头用于采集视频信息并将其发送到ZYNQ平台,ZYNQ平台将视频转换成单帧图像并保存在存储器中,可编程逻辑模块进行一系列计算后将运算结果返回处理器,处理器根据运算结果显示相应的人脸关键点,并将处理后的图像存至存储器,最后图像转成满足VGA输出的数据格式并输出到VGA显示器。此种系统具有并行计算能力强,准确率高和预测速度快的优点。

    一种基于Adaboost算法的人脸检测方法

    公开(公告)号:CN110046565B

    公开(公告)日:2023-07-14

    申请号:CN201910279211.6

    申请日:2019-04-09

    Abstract: 本发明公开一种基于Adaboost算法的人脸检测方法,步骤是:对输入的视频或图像进行预处理,包括进行灰度归一化和滤波去噪;将彩色图像的RGB空间转换为YCbCr空间,然后根据肤色色度的范围,对图像进行肤色分割;对肤色分割后的图像进行形态学处理;采用Canny边缘检测算法对形态学处理后的图像进行边缘检测;利用RHT检测图像中的椭圆,将检测出似人脸的椭圆区域抠出,作为人脸候选区域;利用Adaboost算法训练级联分类器,利用训练好的级联分类器对人脸候选区域进行人脸检测,输出人脸位置。此种人脸检测方法能够在保证检测率的同时,降低计算量,提高检测速度。

    一种基于一维脉动阵列的通用卷积神经网络加速器

    公开(公告)号:CN109934339B

    公开(公告)日:2023-05-16

    申请号:CN201910168042.9

    申请日:2019-03-06

    Abstract: 本发明公开一种基于一维脉动阵列的通用卷积神经网络加速器,AXI4总线接口用于实现模式配置指令的载入以及待计算数据的读取与结果数据的批量发送;模式配置器通过模式配置指令配置各个功能模块为对应工作类型;数据调度模块可并发进行待计算数据缓存、计算数据读取、卷积结果缓存以及卷积结果处理与输出任务;卷积计算模块采用一维脉动阵列的模式进行卷积计算;待计算数据缓存区、卷积结果缓存区、输出结果缓冲FIFO,用于缓存对应数据;结果处理模块进行卷积神经网络中常见的结果处理操作。此种加速器能够兼容卷积神经网络中的不同计算类型并进行高并行度计算来有效加速,同时只需要较低的片外访存带宽需求以及少量的片上存储资源。

    一种基于深度学习的非极大值抑制方法

    公开(公告)号:CN107679469B

    公开(公告)日:2021-03-30

    申请号:CN201710863757.7

    申请日:2017-09-22

    Abstract: 本发明公开了一种基于深度学习的非极大值抑制方法,针对深度学习目标检测算法预测窗口的特点,定义了一种新的置信度指数。提出了改进的窗口筛选准则和依据置信度指数对窗口参数进行加权平均的方法。相比于传统方法有着更高的定位精度,更高的召回率以及更佳的鲁棒性。本方法首先找到每个目标对应的置信度最高的窗口为主窗口,然后在每个窗口附近找到置信度大于阈值且与主窗口的交叠率大于阈值的一批窗口作为子窗口。根据子窗口的位置参数和置信度调整主窗口的位置参数,得到新的窗口。多种情况下的实验表明,在相同的目标检测算法下,本方法得到的窗口更接近于真实窗口。

Patent Agency Ranking