一种针对硬件实现稀疏化卷积神经网络推断的加速方法

    公开(公告)号:CN109711532B

    公开(公告)日:2023-05-12

    申请号:CN201811486547.1

    申请日:2018-12-06

    Abstract: 本发明公开一种针对硬件实现稀疏化卷积神经网络推断的加速方法,包括面对稀疏硬件加速架构的分组剪枝参数确定方法、针对稀疏硬件加速架构的分组剪枝训练方法和针对稀疏化卷积神经网络前向推断的部署方法:根据硬件架构中乘法器数量确定分组剪枝的分组长度和剪枝率,基于量级裁剪方式将压缩率以外的权值进行裁剪,通过增量训练方式提升剪枝后的网络准确率及压缩率,剪枝过的网络经微调后保存非剪枝位置的权值和索引参数并送入硬件架构下的计算单元中,计算单元同时获取分组长度的激活值完成稀疏网络前向推断。本发明基于硬件架构出发设定算法层面的剪枝参数与剪枝策略,有益于降低稀疏加速器的逻辑复杂度提高稀疏加速器前向推断的整体效率。

    一种基于深度学习的非极大值抑制方法

    公开(公告)号:CN107679469A

    公开(公告)日:2018-02-09

    申请号:CN201710863757.7

    申请日:2017-09-22

    CPC classification number: G06K9/6256 G06K9/00228 G06K9/3208

    Abstract: 本发明公开了一种基于深度学习的非极大值抑制方法,针对深度学习目标检测算法预测窗口的特点,定义了一种新的置信度指数。提出了改进的窗口筛选准则和依据置信度指数对窗口参数进行加权平均的方法。相比于传统方法有着更高的定位精度,更高的召回率以及更佳的鲁棒性。本方法首先找到每个目标对应的置信度最高的窗口为主窗口,然后在每个窗口附近找到置信度大于阈值且与主窗口的交叠率大于阈值的一批窗口作为子窗口。根据子窗口的位置参数和置信度调整主窗口的位置参数,得到新的窗口。多种情况下的实验表明,在相同的目标检测算法下,本方法得到的窗口更接近于真实窗口。

    一种基于FPGA的通用定点数神经网络卷积加速器硬件结构

    公开(公告)号:CN107392309A

    公开(公告)日:2017-11-24

    申请号:CN201710810528.9

    申请日:2017-09-11

    CPC classification number: G06N3/063 G06F5/06

    Abstract: 本发明公开了一种基于FPGA的通用定点数神经网络卷积加速器硬件结构,包括:通用AXI4高速总线接口,通用GPIO接口;提供通用的存储器硬件并且支持高并行的读写操作;通用卷积器可对定点数精度配置,可配置卷积操作大小,在完成数据存储后可配合高并行的读写进行高并行的卷积运算;通用读写控制单元,包含对ram、rom、Fifo的读写控制逻辑以及地址产生逻辑;通用状态控制器,针对卷积层和读写、计算过程做出相应的单元运行反应,控制整体的计算流程;通用卷积结果缓存器,采用对卷积结果分段式累加的方法,高速并行对处理结果进行缓存和向总线发送。本发明在基于Yolo算法的人脸检测和基于CNN的人脸识别应用中得到验证,体现出极高的运行速度和较高的数据精度。

    一种基于近红外和远程光电体积描记术的活体检测方法

    公开(公告)号:CN110569760B

    公开(公告)日:2023-05-26

    申请号:CN201910794798.4

    申请日:2019-08-27

    Abstract: 本发明涉及一种基于近红外和远程光电体积描记术的活体检测方法,属于计算、推算、计数的技术领域。该方法:定位待检测对象的面部区域进行人脸识别;对通过人脸识别的对象获取面部的近红外光图像,通过检测近红外光图像获取红外光图像为翻拍自屏幕介质的评分;获取通过屏幕翻拍检测的对象的面部图像序列,利用远程光电体积描记术对待测图像序列进行生命体征信号的提取,辨别待检测对象是否为活体人脸。本发明提高了活体检测的鲁棒性,具备更强的分类和学习能力,能较好地应对三维面具、视频、照片翻拍等表示攻击,区分结果准确率较高。叠加最短周期信号提取生命特征信号的改进型远程光电体积描记术则无需先验知识,能够适应实际使用场景的需求。

    一种针对硬件实现稀疏化卷积神经网络推断的加速方法

    公开(公告)号:CN109711532A

    公开(公告)日:2019-05-03

    申请号:CN201811486547.1

    申请日:2018-12-06

    Abstract: 本发明公开一种针对硬件实现稀疏化卷积神经网络推断的加速方法,包括面对稀疏硬件加速架构的分组剪枝参数确定方法、针对稀疏硬件加速架构的分组剪枝训练方法和针对稀疏化卷积神经网络前向推断的部署方法:根据硬件架构中乘法器数量确定分组剪枝的分组长度和剪枝率,基于量级裁剪方式将压缩率以外的权值进行裁剪,通过增量训练方式提升剪枝后的网络准确率及压缩率,剪枝过的网络经微调后保存非剪枝位置的权值和索引参数并送入硬件架构下的计算单元中,计算单元同时获取分组长度的激活值完成稀疏网络前向推断。本发明基于硬件架构出发设定算法层面的剪枝参数与剪枝策略,有益于降低稀疏加速器的逻辑复杂度提高稀疏加速器前向推断的整体效率。

    一种基于元学习的细粒度分类方法

    公开(公告)号:CN109711433A

    公开(公告)日:2019-05-03

    申请号:CN201811451465.3

    申请日:2018-11-30

    Abstract: 本发明公开一种基于元学习的细粒度分类方法,步骤是:建立外部数据集,将数据集分为训练集、验证集和测试集,三者之间的样本类别互不相交,且测试集的样本类别小于训练集;对数据集中的样本进行数据增强;建立卷积神经网络,该卷积神经网络的输入为彩色图片,输出为彩色图片所属类别,分类层的长度等于外部数据集的类别数,损失函数采用softmax loss;采用训练集训练细粒度分类网络;利用测试集对预训练好的卷积神经网络进行测试,并根据测试结果对卷积神经网络进行微调。此种方法可以快速生成一个良好的通用初始化模型,可以使得在测试相关但不同的类别时,仅用较少的样本就可以取得较好的分类效果,来解决细粒度分类时没有大数据集的问题。

Patent Agency Ranking