加速深度神经网络算法的加速芯片的运算装置及方法

    公开(公告)号:CN106529668B

    公开(公告)日:2018-12-04

    申请号:CN201610979814.3

    申请日:2016-11-08

    Abstract: 本发明提供一种加速深度神经网络算法的加速芯片的运算装置及方法,所述装置包括:向量加法处理器模块,进行向量的加法或减法、和/或深度神经网络算法中的池化层算法的向量化的运算;向量函数值运算器模块,深度神经网络算法中的非线性求值的向量化运算;向量乘加器模块,进行向量的乘加运算;所述三个模块执行可编程指令,互相交互以计算神经网络输出结果以及代表中间层之间神经元作用强度的突触权重变化量;所述三个模块中均设置有中间值存储区域,并对主存储器进行读取与写入操作。由此,能够减少对主存储器的中间值读取和写入次数,降低加速器芯片的能量消耗,避免数据处理过程中的数据缺失和替换问题。

    一种用于自动校正访问存储装置数据的装置及方法

    公开(公告)号:CN105609141B

    公开(公告)日:2018-08-10

    申请号:CN201510958912.4

    申请日:2015-12-18

    CPC classification number: G11C29/42

    Abstract: 本发明提出一种用于自动校正访问存储装置数据的装置及方法,涉及数据存储、数据校正等技术领域,该装置存储装置模块,用于存储数据,其中所述存储装置模块包括用于存储数据的区域与用于存储监督位的区域;编码器模块,用于获取数据,并根据所述数据生成对应的监督位;解码器模块,用于当所述存储装置模块读取所述数据时,所述解码器模块根据所述监督位检验所述数据的正确性,当发现所述数据中存在错误数据时,发送错误信号,同时将所述错误数据进行校正,并将校正后的数据发送给读写单元,读写单元将校正后数据重新写回存储装置,以避免数据错误增加。

    加速深度神经网络算法的加速芯片的运算装置及方法

    公开(公告)号:CN106529668A

    公开(公告)日:2017-03-22

    申请号:CN201610979814.3

    申请日:2016-11-08

    CPC classification number: G06N3/063 G06F17/16 G06N3/06

    Abstract: 本发明提供一种加速深度神经网络算法的加速芯片的运算装置及方法,所述装置包括:向量加法处理器模块,进行向量的加法或减法、和/或深度神经网络算法中的池化层算法的向量化的运算;向量函数值运算器模块,深度神经网络算法中的非线性求值的向量化运算;向量乘加器模块,进行向量的乘加运算;所述三个模块执行可编程指令,互相交互以计算神经网络输出结果以及代表中间层之间神经元作用强度的突触权重变化量;所述三个模块中均设置有中间值存储区域,并对主存储器进行读取与写入操作。由此,能够减少对主存储器的中间值读取和写入次数,降低加速器芯片的能量消耗,避免数据处理过程中的数据缺失和替换问题。

    加法器装置、数据累加方法及数据处理装置

    公开(公告)号:CN105512724A

    公开(公告)日:2016-04-20

    申请号:CN201510863726.2

    申请日:2015-12-01

    CPC classification number: G06F7/50 G06N3/06

    Abstract: 本发明公开一种加法器装置、数据累加方法及数据处理装置,所述加法器装置包括:第一加法器模块,具有由多级加法器阵列构成的加法树单元和第一控制单元,加法树单元基于第一控制单元的控制信号采用逐级累加的方式累加数据;第二加法器模块,包括两输入加减操作单元和第二控制单元,对输入数据进行加法或减法运算;移位操作模块,用于对第一加法器模块的输出数据进行左移位操作;与操作模块,用于对移位操作模块的输出数据和第二加法器模块的输出数据进行与操作;控制器模块,用于控制第一加法器模块及第二加法器模块的数据输入,控制移位操作模块的移位操作,以及控制第一控制单元及第二控制单元的控制信号的发射。由此,实现数据快速累加。

    一种基于联合聚类域自适应的图片分类方法和系统

    公开(公告)号:CN113936167A

    公开(公告)日:2022-01-14

    申请号:CN202111088083.0

    申请日:2021-09-16

    Abstract: 本发明提出一种基于联合聚类域自适应的图片分类方法和系统,包括:通过特征提取网络可分别提取源域图片数据和目标域图片数据的特征,得到源域特征和目标域特征;基于源域特征和目标域特征到聚类中心的距离显式表达域内类别条件分布概率;最小化源域数据标签与域内类别条件分布概率的相对熵距离,更新特征提取网络与类别聚类中心;最小化目标域数据的标签分配与域内类别条件分布概率的相对熵距离,再次更新特征提取网络与聚类中心;将待分类图片输入经过再次更新的特征提取网络,得到待分类图片的图片特征,计算图片特征与经过再次更新的类别聚类中心中所有类别中心的概率,取概率最大的类别作为待分类图片的图片分类结果。

    神经网络运算装置及应用其进行运算的方法

    公开(公告)号:CN108170640A

    公开(公告)日:2018-06-15

    申请号:CN201711452014.7

    申请日:2017-10-17

    Abstract: 本公开提供一种神经网络运算装置和方法,其中装置包括:运算部分,用于完成所述卷积运算,包含多个运算单元组,多个所述运算单元组呈X行Y列的阵列式分布,运算单元组间以S形方向和/或逆S形方向传递数据,其中X和Y分别为正整数;缓存,用于向所述运算单元组传送数据以及接收运算单元组运算后的数据。通过采用S形和逆S形在运算单元中完成数据的传递,从而能够有效加速神经网络运算的同时,降低了权值的反复读取和部分和反复存取所带来的访存功耗。

    计数方法及装置
    17.
    发明公开

    公开(公告)号:CN108052984A

    公开(公告)日:2018-05-18

    申请号:CN201711467274.1

    申请日:2017-10-30

    Abstract: 本公开提供了一种计数方法,包括:对一FAST R‑CNN或YOLO深度神经网络进行训练;以及利用训练后的FAST R‑CNN或YOLO深度神经网络对待计数的图像中包含的计数目标物体进行计数。本公开还提供了一种计数装置。本公开计数方法及装置应用范围广,可针对任意计数对象进行计数,节省人力并且提供了更高的通用性。

    一种用于DRAM或eDRAM刷新的装置及其方法

    公开(公告)号:CN106856098A

    公开(公告)日:2017-06-16

    申请号:CN201611080414.5

    申请日:2016-11-30

    Abstract: 本发明公开了一种用于DRAM或eDRAM刷新的装置及其方法,DRAM或eDRAM设置有存储单元,该装置包括:存储控制装置、刷新控制装置;所述存储控制装置,用于接收读写请求,并根据所述刷新控制装置的输出决定向存储单元发送读写请求或刷新请求;所述刷新控制装置,用于控制生成刷新信号,并根据所述存储控制装置的输出来记录刷新是否被延迟和读写的行地址。本发明能够减少读写与刷新之间的冲突,达到增加DRAM或者eDRAM性能的效果。

    数据累加装置、方法及数字信号处理装置

    公开(公告)号:CN105528191B

    公开(公告)日:2017-04-12

    申请号:CN201510862723.7

    申请日:2015-12-01

    CPC classification number: G06F7/50

    Abstract: 本发明公开一种数据累加装置、方法及数字信号处理装置,所述装置包括:累加树模块,采用二叉树结构的形式对输入数据进行累加,并输出累加结果数据;寄存模块,包含多组寄存器,对累加树模块在累加过程中产生的中间值数据及累加结果数据进行寄存;控制电路,生成数据选通信号以控制累加树模块过滤不需要累加的输入数据,以及生成flag标志信号以进行如下控制:选择将一个或多个存储于寄存器中的中间值数据与所述累加结果相加后的结果作为输出数据,或者选择直接将累加结果作为输出数据。由此,能够在一个时钟周期节拍内快速的将多组输入数据累加至一组和值。同时,所述累加装置可通过控制信号灵活选择同时累加多个输入数据中的部分数据。

    基于分形树结构的数据发布装置、方法、控制装置及智能芯片

    公开(公告)号:CN105634960A

    公开(公告)日:2016-06-01

    申请号:CN201510983306.8

    申请日:2015-12-24

    CPC classification number: H04L12/44 H04L45/02 H04L47/782 H04L47/805

    Abstract: 本发明提出基于分形树结构的数据发布装置、方法、控制装置及智能芯片,该装置包括一中心节点,其为所述片上网络的通信数据中心,用于向所述多个叶子节点进行通信数据的广播或多播;多个叶子节点,其为所述片上网络的通信数据节点,用于向所述中心叶子节点进行通信数据的传递;转发器模块,用于连接所述中心节点与所述多个叶子节点,通信数据通过所述转发模块进行转发;将所述多个叶子节点分为N组,每组中叶子节点的个数相同,所述中心节点通过所述转发模块单独与每一组叶子节点进行通信连接,每组叶子节点构成的通信结构具有自相似性,所述多个叶子节点与所述中心节点通过多层所述转发器模块以完全多叉树方式进行通信连接。

Patent Agency Ranking