-
公开(公告)号:CN119847977A
公开(公告)日:2025-04-18
申请号:CN202510026194.0
申请日:2025-01-08
Applicant: 中国科学院计算技术研究所
IPC: G06F15/177 , G06N5/01 , G06F9/50
Abstract: 本发明的实施例提供了一种用于多芯粒的可重构存内计算加速器的布局方法,包括:获取与布局相关的加速器参数和应用程序的应用参数;根据加速器参数和应用参数,将应用程序中的算子转换为加速器支持的功能,得到应用程序所需的各功能及其数量;模拟将每个功能独立配置到加速器的单个芯粒上,得到初始布局;多次执行预设优化方式以迭代优化布局,得到布局结果,包括:执行粗粒度优化操作,其包括:使用模拟退火算法对输入的布局进行迭代优化,优化时的扰动方式是随机交换其中两个芯粒上配置的功能,优化函数为基于布局计算的各芯粒间总的数据传输开销;执行功能整合操作,其包括:基于加速器参数尝试对粗粒度优化操作优化后的布局进行功能整合。
-
公开(公告)号:CN118586345A
公开(公告)日:2024-09-03
申请号:CN202410628587.4
申请日:2024-05-21
Applicant: 中国科学院计算技术研究所
IPC: G06F30/392 , G06F30/398
Abstract: 提供一种芯片系统,由多个芯粒互联构成,其中,每个芯粒包括一个芯粒间路由模块,每个芯粒与相邻芯粒通过各自的所述芯粒间路由模块连接通信;所述芯粒间路由模块包括:与第一方向相对应的第一端口,与第二方向相对应的第二端口,与第三方向相对应的第三端口以及与第四方向相对应的第四端口,其中所述第二方向与所述第一方向垂直,所述第三方向与所述第一方向相反,所述第四方向与所述第二方向相反;其中,所述芯粒间路由模块包括寄存器配置模块,用于动态配置数据路由方式和数据传输路径。
-
公开(公告)号:CN117313811A
公开(公告)日:2023-12-29
申请号:CN202311271368.7
申请日:2023-09-28
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种用于图像处理的神经网络加速器装置,所述装置包括:乘累加运算模块,其配置有多个矩阵运算单元,用于进行连续乘累加运算;数据存储模块,其被配置为多级存储结构,用于对数据进行分层多级存储并进行数据共享;数据管理模块,用于进行运算数据的调用与存储空间的分配;通用处理器,用于进行外参矩阵求解运算;辅助运算模块,用于进行乘累加运算、外参矩阵求解运算以外的其他不能分解的运算。本发明将特征点匹配、深度预测以及深度融合三个运算载荷大的运算主体分配给三个矩阵运算单元,并对运算时间、算子比例进行合理分配,可使各单元运算互不干扰,达到三级流水线的并行处理效果,提升加速器针对图像处理的高效性与兼容性。
-
公开(公告)号:CN112132272B
公开(公告)日:2023-09-12
申请号:CN202010999082.0
申请日:2020-09-22
Applicant: 中国科学院计算技术研究所
IPC: G06N3/063
Abstract: 本发明提供了一种神经网络的计算装置、处理器和电子设备,其中,计算装置包括:逻辑运算电路和通路选择模块;所述通路选择模块,用于根据接收的神经网络中的计算元素所占用的位宽控制所述逻辑运算电路包括的多个计算电路中的一个计算电路导通;所述逻辑运算电路,用于基于所述导通的计算电路对所述计算元素进行运算,获得所述计算元素对应的计算结果。通过根据计算元素占用的位宽不同,控制逻辑运算电路导通不同的计算电路,实现可对不同位宽的计算元素进行计算,应用到神经网络的计算中,可实现对二值神经网络和三值神经网络的计算,实现了对二值神经网络和三值神经网络的运算加速。
-
公开(公告)号:CN110222846B
公开(公告)日:2021-07-20
申请号:CN201910393609.2
申请日:2019-05-13
Applicant: 中国科学院计算技术研究所
IPC: G06N20/00 , G06F40/279 , G06K9/62 , G10L15/26
Abstract: 本发明提供一种面向互联网终端的信息安防方法及信息安防系统,其中,信息安防方法适用于用户的终端设备,信息安防方法包括:步骤1,终端设备获取用于检测有害信息的信息识别模型的离线训练结果,并根据该离线训练结果,初始化或更新信息识别模型的参数和权重;步骤2,终端设备接收外部的信息数据,并根据信息数据的数据种类,生成信息数据的待检测样本,并根据信息识别模型、参数以及权重,利用前向运算,检测待检测样本,生成信息识别结果;步骤3,终端设备根据信息识别结果,对接收到的信息数据进行处理。通过本发明的技术方案,有效阻止了有害信息的传播至用户,解决了由于数据量过大而导致云端或服务器端或路由器端信息处理遗漏问题。
-
公开(公告)号:CN108446761B
公开(公告)日:2021-07-20
申请号:CN201810244097.9
申请日:2018-03-23
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种神经网络加速器,包括存储单元,用于存储LSTM网络的神经元数据和权值数据并输出;向量乘累加矩阵单元,用于从所述存储单元接收数据并针对所述接收的数据执行向量乘累加运算并输出运算结果;加法单元,用于从所述向量乘累加矩阵单元接收数据,并针对所述接收的数据执行偏移量加法操作;激活单元,用于从所述多功能运算单元和/或所述存储单元接收数据,并针对所述接收的数据执行激活操作并输出激活结果;向量平行乘累加单元,用于从所述激活单元和/或所述存储单元接收数据,并针对所述接收的数据执行乘法和累加操作。各模块通过端对端链接组成以权值行向量为单位与输入向量执行数据处理的流水线工作机制。
-
公开(公告)号:CN109359730B
公开(公告)日:2020-12-29
申请号:CN201811122004.1
申请日:2018-09-26
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种面向固定输出范式Winograd卷积的运算单元和基于该运算单元的神经网络处理器。该运算单元包括取反单元、累加单元和第一选通器,取反单元的输出端连接至累加单元的输入端,第一选通器用于控制将待计算的输入数据传递至取反单元的输入端或传递至累加单元的输入端,累加单元分时接收待计算的输入数据、取反单元的输出值或累加单元的输出值以利用加减运算实现Winograd卷积中的矩阵转换操作。利用本发明运算单元用于神经网络的卷积运算,能够提高计算效率并降低运行功耗。
-
公开(公告)号:CN108388943B
公开(公告)日:2020-12-29
申请号:CN201810014396.3
申请日:2018-01-08
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种适用于神经网络的池化装置,包括神经元输入接口模块,用于接收神经元数据,并识别有效神经元数据;池化缓存模块,用于暂存复用神经元数据;池化计算模块,用于完成针对神经元数据的池化计算;神经元输出接口模块,用于输出池化计算结果;以及池化控制模块,用于控制所述池化装置的各个模块和池化过程。
-
公开(公告)号:CN108171328B
公开(公告)日:2020-12-29
申请号:CN201810175352.9
申请日:2018-03-02
Applicant: 中国科学院计算技术研究所
IPC: G06N3/063
Abstract: 本发明提供了一种卷积运算方法和基于该方法的神经网络处理器。该卷积运算方法包括:获取卷积域内待执行卷积运算的权重向量和神经元向量,其中所述权重向量和所述神经元向量具有相同的维度;从所述权重向量查找有效权重并从所述神经元向量查找有效神经元,匹配获得有效元素子组,其中,每一个有效元素子组包括一个有效权重以及与该有效权重对应的一个有效神经元,所述有效权重是非零权重,所述有效神经元是非零神经元;针对所述有效元素子组执行卷积运算。利用本发明的方法和神经网络处理器能够降低卷积计算量,从而提高计算效率。
-
公开(公告)号:CN107766292B
公开(公告)日:2020-12-29
申请号:CN201711038320.6
申请日:2017-10-30
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种神经网络处理方法和处理系统。该处理方法包括以下步骤:基于池化参数确定相对于原卷积域的增大卷积域;将所述增大卷积域划分为多个子卷积域,其中,每个子卷积域的尺寸与原卷积域的尺寸相等;执行所述多个子卷积域的神经元与相应卷积核权值的卷积运算,以获得多个子卷积结果;对所述多个子卷积结果执行池化处理。利用本发明的处理方法能够提高数据处理的效率和资源利用率。
-
-
-
-
-
-
-
-
-