一种基于稀疏向量矩阵计算的神经网络加速器及加速方法

    公开(公告)号:CN113537488A

    公开(公告)日:2021-10-22

    申请号:CN202110725493.5

    申请日:2021-06-29

    Abstract: 本发明公开了一种基于稀疏向量矩阵计算的神经网络加速器及加速方法。神经网络加速器包括多个稀疏向量矩阵计算单元,稀疏向量矩阵计算单元包括激活队列FIFO、地址读取单元、稀疏权重SRAM、算术运算单元、输出缓存模块、relu模块以及非零数据检测单元。本发明利用CSC稀疏数据压缩算法和稀疏向量矩阵计算单元,减少了计算量和对外部存储器的访问,对神经网络的inference进行加速,可以提高CNN的实时性,实现了更高的计算性能,同时降低了能耗。

    一种基于位稀疏计算的神经网络加速方法

    公开(公告)号:CN112734021A

    公开(公告)日:2021-04-30

    申请号:CN202011625895.X

    申请日:2020-12-31

    Abstract: 本发明公开了一种基于位稀疏计算的神经网络加速方法。首先进行动态定点量化,将浮点数据转化为动态定点数据;为了提高数据位的稀疏程度,采用二进制编码和booth编码。最后对于神经网络的加速,针对卷积层和全连接层进行神经网络加速单元设计。神经网络加速单元包括数据读取模块、片上缓存模块、位稀疏运算模块和累加模块,用于完成卷积层和全连接层的运算。本发明利用数据动态定点化、高并行度、数据复用、位稀疏运算模块,减少了冗余无用的计算和内存访问,对神经网络的inference进行加速,可以提高CNN的实时性,实现了较高的计算性能,同时降低了能耗。

    一种基于FPGA的软硬件协同的加速方法

    公开(公告)号:CN111178518A

    公开(公告)日:2020-05-19

    申请号:CN201911350336.X

    申请日:2019-12-24

    Abstract: 本发明提供一种基于FPGA的软硬件协同的加速方法。本发明首先通过数据量化方式对深度学习模型网络参数进行压缩,然后将经过量化得到的定点数据输入神经网络加速器进行处理,神经网络加速器括AXI4总线接口、卷积计算模块、数据缓存模块、数据处理模块;本发明利用软件部分对神经网络模型压缩,硬件部分为设计特定的硬件架构(神经网络加速器),减少计算量并且利用高并行度来进行有效加速,同时减少内存访问次数来降低硬件能耗。本发明利用卷积计算时的运行信息和算法结构,减少了冗余无用的计算和参数数据的读取,并利用FPGA硬件平台对神经网络的inference进行加速,可以提高DCNN的实时性,实现了较高的计算性能,并且降低了能耗。

    一种低功耗的处理器
    5.
    发明授权

    公开(公告)号:CN112486312B

    公开(公告)日:2022-10-18

    申请号:CN202011300735.8

    申请日:2020-11-19

    Abstract: 本发明公开了一种低功耗的处理器,包括取指模块、译码模块、执行模块、访存模块、写回模块、功耗管理模块、流水线控制模块以及数据模块,其工作模式划分为正常模式和低功耗模式,在正常模式,通过所需调用的数据动态选择SRAM可以有效的避免传输数据的供应不足或者资源浪费,其中取指模块、译码模块、执行模块、访存模块、写回模块之间的5级流水线设计可以有效提高处理器的吞吐量,控制位的设置会提前对指令的有效性进行判定以防造成无用功耗浪费,当处理器进入低功耗模式,则会启动监管机制,若出现闲置的模块、单元会将其逐步关闭以节省功耗,在保持处理器性能的同时降低其功耗以应对不同的应用场景,解决了硬件资源浪费的问题。

    一种基于FPGA的运动目标识别系统及方法

    公开(公告)号:CN113409355A

    公开(公告)日:2021-09-17

    申请号:CN202110523562.4

    申请日:2021-05-13

    Abstract: 本发明公开了一种基于FPGA的运动目标识别系统及方法,由数据信号采集模块完成对目标区域实时的视频图像采集,通过数据信号预处理模块负责将视频序列图像数据有序读出,经过中值滤波去噪、边缘检测得到实时的二值化图像,再利用帧间差分的方法提取运动目标,完成运动目标标定框的定位;通过目标识别模块将运动目标标定框里的内容作为待测图像,经过前处理单元、量化单元,然后利用神经网络检测单元对待测图像进行识别。本发明反复充分利用FPGA的运算资源和视频相邻帧的关联性,更加快速的完成针对视频序列中运动物体进行定位并识别出物体的类别,更好的达到实时的检测速度和低功耗运行状态,从而适应运动目标识别的室外应用场景。

    一种低功耗的处理器
    7.
    发明公开

    公开(公告)号:CN112486312A

    公开(公告)日:2021-03-12

    申请号:CN202011300735.8

    申请日:2020-11-19

    Abstract: 本发明公开了一种低功耗的处理器,包括取指模块、译码模块、执行模块、访存模块、写回模块、功耗管理模块、流水线控制模块以及数据模块,其工作模式划分为正常模式和低功耗模式,在正常模式,通过所需调用的数据动态选择SRAM可以有效的避免传输数据的供应不足或者资源浪费,其中取指模块、译码模块、执行模块、访存模块、写回模块之间的5级流水线设计可以有效提高处理器的吞吐量,控制位的设置会提前对指令的有效性进行判定以防造成无用功耗浪费,当处理器进入低功耗模式,则会启动监管机制,若出现闲置的模块、单元会将其逐步关闭以节省功耗,在保持处理器性能的同时降低其功耗以应对不同的应用场景,解决了硬件资源浪费的问题。

    剪刀(一字)
    9.
    外观设计

    公开(公告)号:CN301870885S

    公开(公告)日:2012-03-28

    申请号:CN201130329266.8

    申请日:2011-09-20

    Designer: 李扬

    Abstract: 1.本外观设计产品的名称:剪刀(一字)。2.本外观设计产品的用途:一种剪刀。3.本外观设计的设计要点:形状。4.最能表明设计要点的图片或者照片:立体图。5.其它视图无设计要点,故省略。

    衣架(2)
    10.
    外观设计

    公开(公告)号:CN301865741S

    公开(公告)日:2012-03-21

    申请号:CN201130325865.2

    申请日:2011-09-16

    Designer: 李扬

    Abstract: 1.本外观设计产品的名称:衣架(2)。2.本外观设计产品的用途:用于晾晒衣服。3.本外观设计的设计要点:产品的各个视图和轮廓。4.最能表明设计要点的图片或者照片:主视图。5.该产品为平面产品,故省略其它视图。

Patent Agency Ranking