一种基于FPGA的卷积神经网络片上训练加速器

    公开(公告)号:CN113298237A

    公开(公告)日:2021-08-24

    申请号:CN202110697592.7

    申请日:2021-06-23

    Applicant: 东南大学

    Abstract: 本发明公开一种基于FPGA的卷积神经网络片上训练加速器,属于计算、推算或计数的技术领域。本卷积神经网络片上训练加速器主要包括:输入数据缓存器、权重数据缓存器、中间运算值缓存器、多模式PE运算单元、最值统计模块、批量归一化模块、激活函数运算模块、量化模块、最大池化模块、梯度更新模块、批量归一化更新模块、编码模块以及逻辑控制模块。本发明通过对各模块的优化设计,实现同时对多张图进行运算,增加了硬件加速器运行时的并行性,降低了对硬件资源的需求,并减少训练过程中的数据流动量,提高了运算效率。本发明通过尽可能充分利用硬件资源,而较为创新地提出了在资源有限的FPGA开发板上进行卷积神经网络训练的实现方法。

    一种基于交替对抗迁移学习的单样本人脸识别方法

    公开(公告)号:CN112329536A

    公开(公告)日:2021-02-05

    申请号:CN202011071997.1

    申请日:2020-10-09

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于交替对抗迁移学习的单样本人脸识别方法,属于计算、推算或计数的技术领域。该方法,采集待识别者的单张人脸样本并标注,设定该图像集合为“源域”;采集应用场景下的大量无标注人脸样本,设定该图像集合为“目标域”;搭建深度对抗迁移神经网络,在特征提取模块中增加特征通道加权模块,并使用大数据集对卷积网络特征提取器进行预训练;以“源域”图片与“目标域”图片为输入,对图片的标签的预测为输出;采用交替冻结的方式轮替训练特征提取器和特征通道加权模块,通过特征通道加权模块的特征重校准使得卷积网络特征提取器充分学习到样本整体分布以提取出高聚类的特征,并最终提高深度对抗迁移神经网络的人脸识别精度。

    一种可配置的通用卷积神经网络加速器

    公开(公告)号:CN110390384A

    公开(公告)日:2019-10-29

    申请号:CN201910554533.7

    申请日:2019-06-25

    Applicant: 东南大学

    Abstract: 本发明公开了一种可配置的通用卷积神经网络加速器,属于计算、推算、计数的技术领域。该加速器包括:PE阵列、状态控制器、功能模块、权重缓存区、特征图缓存区、输出缓存区和寄存器栈,状态控制器包括网络参数寄存器和工作状态控制器。通过配置网络参数寄存器对不同规模的网络均能取得优异的加速效果,工作状态控制器控制着加速器工作状态的切换并将控制信号发送至其它模块。权重缓存区、特征图缓存区和输出缓存区均由多个数据子缓存区构成,用于分别存放权重数据、特征图数据和计算结果。本发明能够针对不同的网络特点,配置合适的数据重用模式、阵列尺寸和子缓存区个数,通用性好,功耗低,吞吐量高。

    一种基于幂指数量化的神经网络压缩方法

    公开(公告)号:CN110245753A

    公开(公告)日:2019-09-17

    申请号:CN201910445413.3

    申请日:2019-05-27

    Applicant: 东南大学

    Abstract: 本发明涉及人工智能神经网络技术领域,具体公开一种基于幂指数量化的神经网络压缩方法。该方法,在外部数据集上训练卷积神经网络后获取该网络的初始化权值参数;根据权值参数绝对值的大小以及分组阈值将权值参数分为两组,绝对值超过阈值的一组基于预先设定的位宽及绝对值最大的权值参数量化大于分组阈值的一组权值参数,将权值参数量化为2的幂或者0;对小于分组阈值的权值参数再训练后执行分组再量化的循环操作,直至网络收敛。本发明在保证参数的取值范围不被压缩的同时在一定程度上减小量化对最终目标检测准确率的影响,解决了量化后准确率下降过多以及硬件实现难度大的问题。

    一种基于特征复用的人脸识别方法

    公开(公告)号:CN109214263A

    公开(公告)日:2019-01-15

    申请号:CN201810702467.9

    申请日:2018-06-30

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于特征复用的人脸识别方法,属于计算推算的技术领域,尤其涉及人脸识别的计算机视觉技术领域。该方法利用外部数据集训练人脸特征提取器,通过多次等步长卷积及特征图拼接的方式分级提取本地数据集中各成员对应的参考特征以构成参考特征空间,对比待测试样本的特征向量和参考特征以确定与待测试样本的特征向量最相似的参考特征,在与待测试样本的特征向量最相似的参考特征满足阈值要求时,以与待测试样本的特征向量最相似的参考特征所属成员的身份为待测试样本的身份,否则,返回待测试样本身份识别失败的消息,以较少的计算资源实现了人脸的快速识别。

    一种基于肤色和Adaboost算法的人脸检测方法

    公开(公告)号:CN104504383A

    公开(公告)日:2015-04-08

    申请号:CN201510019489.1

    申请日:2015-01-14

    Applicant: 东南大学

    CPC classification number: G06K9/00234 G06K9/00275 G06K9/6257

    Abstract: 本发明公开了一种基于肤色和Adaboost算法的人脸检测方法,输入的图像或视频经预处理后,由RGB空间经非线性分段变换为YCb’Cr’空间,再经二值化处理及形态学处理,得到分割好的肤色区域;将利用Adaboost算法训练好的级联分类器对分割好的肤色区域进行人脸检测,输出结果,完成检测。本发明的人脸检测算法,既保证检测率又保证效率,利用非线性颜色空间分段转换弥补传统的线性转换带来的不精确性,确保肤色像素最大化的被提取出来;重新训练的Adaboost级联分类器,能够减少原有级联分类器的级数,减少训练时间,提高检测速度。

    一种基于神经网络架构搜索的无监督领域自适应方法

    公开(公告)号:CN113313255B

    公开(公告)日:2024-05-24

    申请号:CN202110675052.9

    申请日:2021-06-18

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于神经网络架构搜索的无监督领域自适应方法,该方法通过构建可用于可微分网络架构搜索的网络结构,将实际输入样本的特征图和训练样本的特征图的欧式距离作为损失函数,按序交叉搜索更新网络的结构参数和权重参数,最后选择性能最优的一组参数构建网络模型;本发明使神经网络模型有更强的自适应能力,并且本方法中对网络中各操作赋予权重的结构,可以使网络结构的搜索和更新更加简便快捷、同时降低改变网络结构后的重训练所需的计算代价,使本方法易于在可移动嵌入式终端实施。

    一种基于迁移学习的人脸属性分析方法

    公开(公告)号:CN109325398B

    公开(公告)日:2020-10-09

    申请号:CN201810702472.X

    申请日:2018-06-30

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于迁移学习的人脸属性分析方法,属于计算推算的技术领域,尤其涉及识别人脸属性的计算机视觉技术领域。本发明在多属性预测网络上联合训练样本集以预测特征属性,将收敛的多属性预测网络迁移到主属性预测网络,继续训练主属性预测网络并微调参数直至主属性预测网络的损失函数收敛,所述主属性包含但不限于基于逻辑回归的人脸属性以及基于线性回归的人脸属性的主属性,既防止了局部极小,又避免了任务过于复杂导致的精度降低,在实际应用中更加精确灵活。

    一种基于局部感受野的人脸验证方法

    公开(公告)号:CN111582057A

    公开(公告)日:2020-08-25

    申请号:CN202010310755.7

    申请日:2020-04-20

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于局部感受野的人脸验证方法,属于计算、推算或计数的技术领域。步骤是:建立外部数据集,对数据集中的样本进行数据增强;建立卷积神经网络,该卷积神经网络的输入为彩色图片,输出为图片中人脸区域对应的特征向量和人脸位置的预测框坐标,测试时根据预测框在图像中的位置输出对应区域的特征向量;利用测试集对预训练好的卷积神经网络进行测试并根据测试结果对卷积神经网络进行微调。本发明根据深度神经网络的平移不变性,利用一个网络有效提取出人脸区域的特征,使特征向量的感受野恰好仅包含人脸,从而有效减少背景信息带来的噪声,保证人脸验证的准确率,同时提升了网络计算的并行度,大大简化了训练过程。

    一种应用于正交频分复用系统的载波同步的方法

    公开(公告)号:CN104168227A

    公开(公告)日:2014-11-26

    申请号:CN201410380674.9

    申请日:2014-08-04

    Applicant: 东南大学

    Abstract: 本发明公开了一种应用于正交频分复用系统中载波同步的方法,包括以下步骤:1)OFDM系统的发射模块在有效OFDM符号前发送用于载波频偏估计的训练序列;2)根据接收到的训练序列的第一组移位相关序列的相位信息进行粗载波频偏估计;3)根据接收到的训练序列的第二组移位相关序列的相位信息进行细载波频偏估计;4)根据粗载波频偏估计值与细载波频偏估计值得到总的载波频偏估计值;5)根据总的载波频偏估计值进行载波频偏补偿;本发明提出的载波同步方法不依赖训练序列的特殊结构,能够有较好的估计性能和较低的复杂度,同时本发明的算法拥有较大的估计范围以及较小的估计均方误差,在高斯白噪声信道和多径衰落信道都有良好的性能。

Patent Agency Ranking