-
-
公开(公告)号:CN109190755A
公开(公告)日:2019-01-11
申请号:CN201811040908.X
申请日:2018-09-07
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种面向神经网络的矩阵转换装置,包括:数据接收接口,用于接收并传递神经网络的待转换矩阵数据;转换矩阵接收接口,用于接收并传递对应于所述待转换矩阵数据的转换矩阵;矩阵运算单元,与所述数据接收接口和所述转换矩阵接收接口分别连接,利用所述待转换矩阵数据和所述对应的转换矩阵执行矩阵转换运算;输出接口,与所述矩阵运算单元相连,用于拼接并输出所述矩阵运算单元获得的运算结果;暂存单元,与所述数据接收接口和所述输出接口相连,用于暂存所述输出接口输出的运算结果,并将所述运算结果输入至所述数据接收接口。
-
公开(公告)号:CN108446761A
公开(公告)日:2018-08-24
申请号:CN201810244097.9
申请日:2018-03-23
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种神经网络加速器,包括存储单元,用于存储LSTM网络的神经元数据和权值数据并输出;向量乘累加矩阵单元,用于从所述存储单元接收数据并针对所述接收的数据执行向量乘累加运算并输出运算结果;加法单元,用于从所述向量乘累加矩阵单元接收数据,并针对所述接收的数据执行偏移量加法操作;激活单元,用于从所述多功能运算单元和/或所述存储单元接收数据,并针对所述接收的数据执行激活操作并输出激活结果;向量平行乘累加单元,用于从所述激活单元和/或所述存储单元接收数据,并针对所述接收的数据执行乘法和累加操作。各模块通过端对端链接组成以权值行向量为单位与输入向量执行数据处理的流水线工作机制。
-
公开(公告)号:CN108171328A
公开(公告)日:2018-06-15
申请号:CN201810175352.9
申请日:2018-03-02
Applicant: 中国科学院计算技术研究所
IPC: G06N3/063
CPC classification number: G06N3/063
Abstract: 本发明提供了一种卷积运算方法和基于该方法的神经网络处理器。该卷积运算方法包括:获取卷积域内待执行卷积运算的权重向量和神经元向量,其中所述权重向量和所述神经元向量具有相同的维度;从所述权重向量查找有效权重并从所述神经元向量查找有效神经元,匹配获得有效元素子组,其中,每一个有效元素子组包括一个有效权重以及与该有效权重对应的一个有效神经元,所述有效权重是非零权重,所述有效神经元是非零神经元;针对所述有效元素子组执行卷积运算。利用本发明的方法和神经网络处理器能够降低卷积计算量,从而提高计算效率。
-
公开(公告)号:CN107818367A
公开(公告)日:2018-03-20
申请号:CN201711041164.9
申请日:2017-10-30
Applicant: 中国科学院计算技术研究所
IPC: G06N3/04
Abstract: 本发明提供了一种神经网络处理系统。该处理系统包括:计算阵列,用于执行神经元和权值的乘法和累加操作;控制单元,用于控制所述计算阵列的数据传递和加载,其中,所述计算阵列包括:至少一个列处理单元,由多个乘法单元构成,并用于执行神经元和权值的乘法运算,以输出乘积结果;至少一个列累加单元,与所述列处理单元相连,并用于对所述列处理单元的多个乘积结果进行累加;至少一个列暂存单元,与所述列累加单元相连,并用于存储所述列累加单元的计算结果。利用本发明的处理系统,在计算过程中能够实现神经元循环使用,从而提高了计算效率和资源利用率。
-
公开(公告)号:CN107766292A
公开(公告)日:2018-03-06
申请号:CN201711038320.6
申请日:2017-10-30
Applicant: 中国科学院计算技术研究所
CPC classification number: G06F17/153 , G06N3/0454
Abstract: 本发明提供一种神经网络处理方法和处理系统。该处理方法包括以下步骤:基于池化参数确定相对于原卷积域的增大卷积域;将所述增大卷积域划分为多个子卷积域,其中,每个子卷积域的尺寸与原卷积域的尺寸相等;执行所述多个子卷积域的神经元与相应卷积核权值的卷积运算,以获得多个子卷积结果;对所述多个子卷积结果执行池化处理。利用本发明的处理方法能够提高数据处理的效率和资源利用率。
-
公开(公告)号:CN119849422A
公开(公告)日:2025-04-18
申请号:CN202411879483.7
申请日:2024-12-19
Applicant: 中国科学院计算技术研究所
IPC: G06F30/394
Abstract: 本发明提供了一种用于设计芯粒系统的基板布局的方法,包括:获取待布局的各个芯粒的尺寸、基板可布局区域的尺寸、每个芯粒上的各个引脚和基板上的各个端口构成的接口集合、接口集合中各个接口的连接关系以及各个引脚在芯粒上的位置,用于初始化基板布局并以最小化布线的总线长为优化目标进行布局调整,得到第一布局结果;以最小化布局密度和接口间布线的总线长的加权和为优化目标,对第一布局结果进行全局布局优化,得到第二布局结果;对第二布局结果进行调整,使布局符合芯粒间的布局合理性约束,得到第三布局结果,其中,第一至第三布局结果中的每个布局结果包括设于基板的可布局区域内的各个芯粒的布设位置以及各个端口的布设位置。
-
公开(公告)号:CN118246509A
公开(公告)日:2024-06-25
申请号:CN202410385647.4
申请日:2024-04-01
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种计算模块,包括一个多路分配器、一个与门和一个移位寄存器;其中所述多路分配器用于选择并传输1比特至与门的一个输入端,所述与门将从多路分配器接收到的比特值与待计算数据的一个比特值进行乘法运算,所述移位寄存器对获得的运算结果执行位移。本发明提供了一个对数据可实现比特级调整的神经网络处理单元,细粒度的调整计算位宽与传输模式,使包含该处理单元的处理器可在神经网络不同层采用不同的数据精度参与计算,在保证计算精度的前提下,提高了处理速度,减少了片上存储量,降低了能量损耗。
-
公开(公告)号:CN109190755B
公开(公告)日:2021-07-20
申请号:CN201811040908.X
申请日:2018-09-07
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种面向神经网络的矩阵转换装置,包括:数据接收接口,用于接收并传递神经网络的待转换矩阵数据;转换矩阵接收接口,用于接收并传递对应于所述待转换矩阵数据的转换矩阵;矩阵运算单元,与所述数据接收接口和所述转换矩阵接收接口分别连接,利用所述待转换矩阵数据和所述对应的转换矩阵执行矩阵转换运算;输出接口,与所述矩阵运算单元相连,用于拼接并输出所述矩阵运算单元获得的运算结果;暂存单元,与所述数据接收接口和所述输出接口相连,用于暂存所述输出接口输出的运算结果,并将所述运算结果输入至所述数据接收接口。
-
公开(公告)号:CN108416435B
公开(公告)日:2020-07-31
申请号:CN201810223448.8
申请日:2018-03-19
Applicant: 中国科学院计算技术研究所
IPC: G06N3/063
Abstract: 本发明提供一种神经网络处理器以及设计和使用方法。所述神经网络处理器,包括卷积装置和激活装置,其特征在于所述激活装置包括:输入接口、激活运算单元、和输出接口;其中,所述输入接口用于接收来自所述卷积装置的待激活神经元,所述输入接口的带宽与所述卷积装置输出待激活神经元的速度相关;所述激活运算单元,用于对来自所述输入接口的待激活神经元进行激活处理,所述激活运算单元的运算速度与所述卷积装置输出待激活神经元的速度相关;所述输出接口,用于输出激活处理的结果,所述输出接口的带宽与所述激活运算单元的运算速度相对应。
-
-
-
-
-
-
-
-
-