基于深度可分离卷积的轻量级神经网络硬件加速器

    公开(公告)号:CN113033794B

    公开(公告)日:2023-02-28

    申请号:CN202110332526.X

    申请日:2021-03-29

    Applicant: 重庆大学

    Abstract: 本发明公开了一种基于深度可分离卷积的轻量级神经网络硬件加速器,包括A路K×K通道卷积处理单元并行阵列、A路1×1点卷积处理单元并行阵列以及用于缓冲卷积神经网络和输入输出特征图的片上存储器;卷积神经网络是将神经网络MobileNet采用量化感知训练方法压缩所得的轻量级神经网络;A路K×K通道卷积处理单元并行阵列、多路1×1点卷积处理单元并行阵列部署在像素级流水线中;每个K×K通道卷积处理单元包括1个乘法器、1个加法器和1个激活函数计算单元;每个1×1点卷积处理单元包括多路选择器、1个两级加法器树和1个累加器。本发明解决了以往加速器在推理过程产生高能耗片外访存问题,同时节省了资源并提高了处理性能。

    羽毛球捡拾机器人及其控制方法

    公开(公告)号:CN110314349A

    公开(公告)日:2019-10-11

    申请号:CN201910635998.5

    申请日:2019-07-15

    Applicant: 重庆大学

    Abstract: 本发明公开了一种羽毛球捡拾机器人及其控制方法,包括移动小车、捡球装置、定位装置、羽毛球收集装置和控制电路;所述捡球装置包括捡球架组件、两个捡球组件和驱动组件;所述定位装置包括激光雷达、摄像头和摄像头支架;羽毛球收集装置包括羽毛球收集框和进球检测电路;控制电路包括目标识别模块和动作执行模块,所述目标识别模块接收激光雷达和摄像头所采集的数据,根据所接收到的数据识别出羽毛球的坐标信息,并根据羽毛球的坐标信息发出对应运动指令给动作执行模块,所述动作执行模块根据运动指令控制位移电机、驱动组件、飞轮电机和鼓风机执行相应的动作。本发明能够实现对羽毛球的低损伤、高效率的拾取。

    一种纳秒级超窄脉冲测量方法及系统

    公开(公告)号:CN102621383A

    公开(公告)日:2012-08-01

    申请号:CN201210079047.2

    申请日:2012-03-23

    Applicant: 重庆大学

    Abstract: 本发明提出一种纳秒级超窄脉冲测量方法及系统,涉及信号检测领域。系统主要由高速脉冲测量模块、现场可编程门阵列(FPGA)控制模块以及人机交互模块组成。根据可编程时间片的大小和不同测量模式,检测每一时间片内的脉冲最大幅值以及超过某一设定比较阈值的脉冲个数。利用FPGA的高速特性,用硬件实现耗时大的软件算法,提高了程序的执行效率,保证了本发明的高速处理能力,具有很好实时性和可靠性。

    基于FPGA的分布式网络时钟同步系统及方法

    公开(公告)号:CN101252404B

    公开(公告)日:2012-01-04

    申请号:CN200810069526.X

    申请日:2008-03-31

    Applicant: 重庆大学

    Abstract: 本发明请求保护一种基于现场可编程门阵列(FPGA)实现的小型分布式网络时钟同步系统,涉及分布式网络同步技术。它主要包括PC、HUB以及基于FPGA的分布式单元。每个分布式单元都带有通用网络接口,采用固定的同步周期时间方案来实现小型分布式网络的时钟同步,使系统能够达到微秒级的同步。本发明的同步方式采用类似IEEE1588标准的方式,根据该标准的高精度同步特性,改善其初始同步速度,实现一个初始同步速度快、高精度时钟同步的分布式系统。它根据提供分布式网络系统各个组成单元的同步时钟,作为系统的工作时钟的参照。这样,可以满足对实时要求性较高的分布式网络用于传输数据等。

    基于现场可编程门阵列的虹膜识别方法及系统

    公开(公告)号:CN101499134A

    公开(公告)日:2009-08-05

    申请号:CN200910103377.9

    申请日:2009-03-13

    Applicant: 重庆大学

    Abstract: 本发明提出一种基于现场可编程门阵列(FPGA)的虹膜识别系统及其实现方法。以Altera公司的FPGA芯片为主控芯片,由虹膜采集装置、液晶显示屏和PS/2键盘组成系统完整的硬件平台。整个系统实现的功能包括虹膜图像采集、虹膜图像显示、虹膜图像质量评估、虹膜对象录入、虹膜对象识别等。其中虹膜对象录入及虹膜识别过程中的虹膜定位算法提出了一种新颖的简单快速的虹膜定位算法。而虹膜特征提取算法部分,采用二维Gabor滤波算法实现了非常好的特征提取。准确的虹膜定位效果和独特的特征提取算法使本发明实现了一个高识别率高可靠性的虹膜识别系统,用于身份验证。

    基于现场可编程门阵列的多指纹密码识别方法及系统

    公开(公告)号:CN101261679A

    公开(公告)日:2008-09-10

    申请号:CN200810069525.5

    申请日:2008-03-31

    Applicant: 重庆大学

    Abstract: 本发明提出一种基于现场可编程门阵列(FPGA)的多指纹密码系统及其实现方法,采用一块FPGA核心芯片,一个指纹采集器,及其它外围设备。它包括指纹密码产生、指纹密码的存储,和指纹密码的识别。指纹密码即把每一枚指纹作为密码的一个元素,使用者可以按照自己的意愿选择多个手指的指纹进行任意排列组合生成密码。本系统利用FPGA技术作为载体,将指纹识别和密码思想完美结合,实现指纹识别,和密码识别的双重加密功能。只有当输入指纹、指纹次序和指纹个数均与设定的指纹密码一致时,系统才给出匹配成功信号。

    一种基于模态对齐蒸馏的多模态图像配准方法

    公开(公告)号:CN119379750A

    公开(公告)日:2025-01-28

    申请号:CN202411421917.9

    申请日:2024-10-12

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于模态对齐蒸馏的多模态图像配准方法,属于图像处理技术领域。该方法包括:采用一种蒸馏学习引导式的训练流程,使用性能优异的同模态配准教师模型的中间特征和输出变形场对多模态配准学生模型进行引导式监督,迁移学生模型中间特征的模态并有效降低模态差异,输出接近于教师模型估计的高质量变形场,提升多模态配准性能;采用一种可变形掩码训练策略,应对配准过程中空间变换的黑边效应导致的配准结果与标签图像边界不一致的问题(即配准结果的黑边与标签图像原始边界),有效降低其对配准的负面影响,提升模型配准性能。本发明能够实现多模态图像配准任务,有效解决由模态差异带来的配准挑战,达到了多模态图像空间对齐的效果。

    基于时间步的二值脉冲图的脉冲卷积神经网络硬件加速器

    公开(公告)号:CN113033795A

    公开(公告)日:2021-06-25

    申请号:CN202110332549.0

    申请日:2021-03-29

    Applicant: 重庆大学

    Abstract: 本发明公开了一种基于时间步的二值脉冲图的脉冲卷积神经网络硬件加速器,包括第一特征提取器、第二特征提取器、分类引擎和控制器;第一特征提取器设置在第一层,用于卷积计算、膜电位更新以及池化操作;第二特征提取器设置在第二层,用于卷积计算、膜电位更新以及池化操作,该第二特征提取器的输入端与第一特征提取器的输出端连接;所述分类引擎设置在第三层,用于对目标的分类,其由多个并行设置的全连接单元和一个脉冲计数器组成,分类引擎的输入端与第二特征提取器的输出端连接;所述控制器用于负责控制输入权重,该控制器分别与第一特征提取器、第二特征提取器和分类引擎连接。本发明能够提高网络的仿生性,提高了计算效率,节省了资源消耗。

    基于深度可分离卷积的轻量级神经网络硬件加速器

    公开(公告)号:CN113033794A

    公开(公告)日:2021-06-25

    申请号:CN202110332526.X

    申请日:2021-03-29

    Applicant: 重庆大学

    Abstract: 本发明公开了一种基于深度可分离卷积的轻量级神经网络硬件加速器,包括A路K×K通道卷积处理单元并行阵列、A路1×1点卷积处理单元并行阵列以及用于缓冲卷积神经网络和输入输出特征图的片上存储器;卷积神经网络是将神经网络MobileNet采用量化感知训练方法压缩所得的轻量级神经网络;A路K×K通道卷积处理单元并行阵列、多路1×1点卷积处理单元并行阵列部署在像素级流水线中;每个K×K通道卷积处理单元包括1个乘法器、1个加法器和1个激活函数计算单元;每个1×1点卷积处理单元包括多路选择器、1个两级加法器树和1个累加器。本发明解决了以往加速器在推理过程产生高能耗片外访存问题,同时节省了资源并提高了处理性能。

Patent Agency Ranking