-
公开(公告)号:CN105528191A
公开(公告)日:2016-04-27
申请号:CN201510862723.7
申请日:2015-12-01
Applicant: 中国科学院计算技术研究所
IPC: G06F7/50
CPC classification number: G06F7/50 , G06F7/5095
Abstract: 本发明公开一种数据累加装置、方法及数字信号处理装置,所述装置包括:累加树模块,采用二叉树结构的形式对输入数据进行累加,并输出累加结果数据;寄存模块,包含多组寄存器,对累加树模块在累加过程中产生的中间值数据及累加结果数据进行寄存;控制电路,生成数据选通信号以控制累加树模块过滤不需要累加的输入数据,以及生成flag标志信号以进行如下控制:选择将一个或多个存储于寄存器中的中间值数据与所述累加结果相加后的结果作为输出数据,或者选择直接将累加结果作为输出数据。由此,能够在一个时钟周期节拍内快速的将多组输入数据累加至一组和值。同时,所述累加装置可通过控制信号灵活选择同时累加多个输入数据中的部分数据。
-
公开(公告)号:CN105488565A
公开(公告)日:2016-04-13
申请号:CN201510792463.0
申请日:2015-11-17
Applicant: 中国科学院计算技术研究所
IPC: G06N3/06
Abstract: 本发明提供一种加速深度神经网络算法的加速芯片的运算装置及方法,所述装置包括:向量加法处理器模块,进行向量的加法或减法、和/或深度神经网络算法中的pooling层算法的向量化的运算;向量函数值运算器模块,深度神经网络算法中的非线性求值的向量化运算;向量乘加器模块,进行向量的乘加运算;所述三个模块执行可编程指令,互相交互以计算神经网络的神经元值和网络输出结果、以及、代表输入层神经元对输出层神经元作用强度的突触权重变化量;所述三个模块中均设置有中间值存储区域,并对主存储器进行读取与写入操作。由此,能够减少对主存储器的中间值读取和写入次数,降低加速器芯片的能量消耗,避免数据处理过程中的数据缺失和替换问题。
-
公开(公告)号:CN105354006A
公开(公告)日:2016-02-24
申请号:CN201510849130.7
申请日:2015-11-27
Applicant: 中国科学院计算技术研究所
IPC: G06F7/57
CPC classification number: G06F7/57
Abstract: 本发明公开了一种非线性函数的快速运算装置及其方法,其中该装置包括:定义域转换部,用于将输入的自变量转换成查表范围内的对应值;查表部,用于根据输入的自变量或由所述定义域转换部处理后的自变量,查找对应的分段线性拟合的斜率和截距;以及线性拟合部,用于根据所述查表部查表得到的斜率和截距通过线性拟合的方法得到最后结果。本发明解决传统方法带来的运算速度慢,运算装置面积大,功耗高等问题。
-
公开(公告)号:CN108511028B
公开(公告)日:2022-02-08
申请号:CN201810356725.2
申请日:2015-12-18
Applicant: 中国科学院计算技术研究所
IPC: G11C29/42
Abstract: 本公开提供了一种利用纠错码自动校正访问存储装置数据的装置及方法,其中,该利用纠错码自动校正访问存储装置数据的装置包括:存储装置模块,用于存储数据,其包括用于存储数据的区域与用于存储监督位的区域;编码器模块,包括监督位生成模块与合并模块,监督位生成模块用于根据数据生成监督位;合并模块用于将数据与监督位合并;解码器模块,用于当存储装置模块读取数据时,根据监督位检验所读取的数据的正确性,当发现所读取的数据中存在错误数据时,发送错误信号,同时将错误数据进行校正,并将校正后的数据发送给存储装置模块。本公开实现了数据自动校正的目的,避免了数据错误增多导致最后校正失败的情况。
-
公开(公告)号:CN107632965B
公开(公告)日:2019-11-29
申请号:CN201710967772.6
申请日:2017-10-17
Applicant: 中国科学院计算技术研究所
Abstract: 本公开提供一种可重构的S形运算装置和方法,其中装置包括:运算部分,用于完成运算,包含多个运算单元组,多个所述运算单元组呈X行Y列的阵列式分布,运算单元组间以S形方向和/或逆S形方向传递数据,其中X和Y分别为正整数。通过采用S形和逆S形在运算单元中完成数据的传递,从而能够有效加速神经网络运算的同时,降低了权值的反复读取和部分和反复存取所带来的访存功耗。
-
公开(公告)号:CN108052984B
公开(公告)日:2019-11-08
申请号:CN201711467274.1
申请日:2017-10-30
Applicant: 中国科学院计算技术研究所
Abstract: 本公开提供了一种计数方法,包括:对一FAST R‑CNN或YOLO深度神经网络进行训练;以及利用训练后的FAST R‑CNN或YOLO深度神经网络对待计数的图像中包含的计数目标物体进行计数。本公开还提供了一种计数装置。本公开计数方法及装置应用范围广,可针对任意计数对象进行计数,节省人力并且提供了更高的通用性。
-
公开(公告)号:CN107818343A
公开(公告)日:2018-03-20
申请号:CN201711037201.9
申请日:2017-10-30
Applicant: 中国科学院计算技术研究所
Abstract: 本公开提供了一种计数方法,包括:对一深度神经网络进行预训练;利用标记图像对预训练后的所述深度神经网络进行重训练,得到二分类的目标检测神经网络;以及利用所述二分类的目标检测神经网络对待计数的图像中包含的计数目标物体进行计数。本公开还提供了一种计数装置。本公开计数方法及装置应用范围广,可针对任意计数对象进行计数,节省人力并且提供了更高的通用性。
-
公开(公告)号:CN105550157B
公开(公告)日:2017-06-27
申请号:CN201510983380.X
申请日:2015-12-24
Applicant: 中国科学院计算技术研究所
IPC: G06F15/173
CPC classification number: G06F15/173
Abstract: 本发明提出一种分形树结构通信结构、方法、控制装置及智能芯片,该通信结构包括一中心节点,其为所述片上网络的通信数据中心,用于向所述多个叶子节点进行通信数据的广播或多播;多个叶子节点,其为所述片上网络的通信数据节点,用于向所述中心叶子节点进行通信数据的传递;转发器模块,用于连接所述中心节点与所述多个叶子节点,通信数据通过所述转发器模块进行转发;其中,将所述多个叶子节点分为N组,每组中叶子节点的个数相同,所述中心节点通过所述转发器模块单独与每一组叶子节点进行通信连接,所述通信结构为分形树结构,每组叶子节点构成的通信结构具有自相似性,所述转发器模块包括中心转发器模块、叶子转发器模块、中间转发器模块。
-
公开(公告)号:CN105512724B
公开(公告)日:2017-05-10
申请号:CN201510863726.2
申请日:2015-12-01
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开一种加法器装置、数据累加方法及数据处理装置,所述加法器装置包括:第一加法器模块,具有由多级加法器阵列构成的加法树单元和第一控制单元,加法树单元基于第一控制单元的控制信号采用逐级累加的方式累加数据;第二加法器模块,包括两输入加减操作单元和第二控制单元,对输入数据进行加法或减法运算;移位操作模块,用于对第一加法器模块的输出数据进行左移位操作;与操作模块,用于对移位操作模块的输出数据和第二加法器模块的输出数据进行与操作;控制器模块,用于控制第一加法器模块及第二加法器模块的数据输入,控制移位操作模块的移位操作,以及控制第一控制单元及第二控制单元的控制信号的发射。由此,实现数据快速累加。
-
公开(公告)号:CN105630733B
公开(公告)日:2017-05-03
申请号:CN201510983391.8
申请日:2015-12-24
Applicant: 中国科学院计算技术研究所
IPC: G06F15/173
CPC classification number: G06F15/173
Abstract: 本发明提出分形树中向量数据回传处理单元的装置、方法、控制装置及智能芯片,该装置包括一中心节点,接收叶子节点回传的向量数据;多个叶子节点,对向量数据进行计算与移位;转发器模块,包括局部缓存结构与数据处理部件;将所述多个叶子节点分为N组,每组中叶子节点的个数相同,所述中心节点通过所述转发器模块单独与每一组叶子节点进行通信连接,每组叶子节点构成的通信结构具有自相似性,所述多个叶子节点与所述中心节点通过多层所述转发器模块以完全M叉树方式进行通信连接,每个叶子节点包括设置位,如果所述设置位要求叶子节点中的向量数据进行移位,则叶子节点将预设带宽位的向量数据移至相应位置,否则叶子节点将向量数据回传给中心节点。
-
-
-
-
-
-
-
-
-