-
公开(公告)号:CN118550870A
公开(公告)日:2024-08-27
申请号:CN202410496156.7
申请日:2024-04-24
Applicant: 中国科学院计算技术研究所
IPC: G06F15/78
Abstract: 本发明提供了一种通用存内计算加速器,该加速器包括多个处理单元,用于并行执行多个指令缓存中的指令,其中,一个处理单元对应于一个指令缓存,每个处理单元用于执行对应指令缓存中的多条指令,且每个处理单元包括多个存算核,一个存算核用于执行一条指令,且每个存算核包括多个存算阵列,用于存储不同类型的数据,多个存算阵列基于各自存储的数据并行执行同一条指令。本发明上述实施例设计的存内计算加速器支持通用计算任务,提高了本发明上述实施例存内计算加速器在实际应用中的利用率,从而避免了严重的资源浪费。
-
公开(公告)号:CN117718963A
公开(公告)日:2024-03-19
申请号:CN202311790093.8
申请日:2023-12-25
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种用于机器人刚体动力学的专用计算装置,包括:前向后向计算模块,被配置为以矩阵和向量为基础运算单位,根据分发到的数据和预设的状态码计算逆动力学和/或逆动力学的梯度,状态码包括动力学计算的任务类型;后向前向计算模块,被配置为以矩阵和向量为基础运算单位,根据分发到的数据和预设的状态码计算关节空间质量矩阵和/或关节空间质量矩阵的逆;调度模块,被配置为根据预设的状态码选择进行正动力学相关计算后输出或者中继输出;编码模块,被配置为对调度模块的输出进行数据格式转换和编码;本发明提出了一种全新的机器人刚体动力学计算架构,可提升机器人刚体动力学函数计算的性能,提高计算的吞吐量,减少计算能耗。
-
公开(公告)号:CN116128701A
公开(公告)日:2023-05-16
申请号:CN202211500779.4
申请日:2022-11-28
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种用于执行图计算任务的装置,所述装置包括:中央处理器,用于对待进行图计算的图数据集进行预处理以按照图加速器的计算节点数量将其划分为与计算节点数量一致的多个子图;图加速器,其包括多个计算节点,用于接收并处理中央处理器传输的所有子图,每个计算节点处理一个子图的计算并从其他计算节点获取其他计算节点的子图数据以更新自身处理的子图,其中:所述计算节点由一个或多个存内计算器件组成,所有计算节点采用环状拓扑结构依次相联,且计算节点间的数据传输模式为单向传输,下游计算节点从上游计算节点预取数据。本发明提出的装置可以在不带来冗余计算的同时消除对图计算任务性能的影响更大的跨节点间同步操作。
-
公开(公告)号:CN115964015A
公开(公告)日:2023-04-14
申请号:CN202211658543.3
申请日:2022-12-22
Applicant: 中国科学院计算技术研究所
Abstract: 本发明实施例提供一种基于存内计算的稀疏矩阵稠密乘法加速器,该加速器包括:控制器,用于根据当前的计算任务,确定其中稀疏矩阵的所有非零数值、稠密向量的所有非零数值、稀疏矩阵和稠密向量的每个非零数值对应的行索引值和列索引值,且非零数值为浮点数值;CAM阵列,用于存储稀疏矩阵的每个非零数值对应的行索引值和列索引值,根据稠密向量的每个非零数值的行索引值匹配需与之进行计算的稀疏矩阵的每个非零数值的列索引值和行索引值,得到匹配结果;MAC阵列,用于根据CAM阵列的匹配结果关联存储稀疏矩阵的每个非零数值和稠密向量的每个非零数值,并执行关联存储的稀疏矩阵的每个非零数值与稠密向量对应的非零数值间的浮点乘法计算,得到计算结果。
-
公开(公告)号:CN118133911A
公开(公告)日:2024-06-04
申请号:CN202410212878.5
申请日:2024-02-27
Applicant: 中国科学院计算技术研究所
IPC: G06N3/063 , G06N3/0464 , G06N5/04
Abstract: 本发明提供了一种面向存内计算的卷积神经网络加速器的自动综合方法,该方法能够基于卷积神经网络推理任务、存内计算加速器峰值功耗约束、存内计算加速器的硬件参数查找表,采用模拟退火方法得到筛选出在每个参数组合下的卷积神经网络权重复制候选策略,采用遗传方法得到选出性能最优的宏单元映射方案从而获得该方案对应的卷积神经网络权重复制候选策略、存内计算加速器硬件参数组合以及硬件资源分配方案。采用本发明的方法来生成存内计算加速器架构配置的方案大大减少了架构设计的专业门槛,提高了存内计算加速器设计的效率,节省了专家设计的成本,同时有效丰富了加速器架构配置方案的优化策略以保障存内加速器配置方案的设计质量。
-
公开(公告)号:CN119847977A
公开(公告)日:2025-04-18
申请号:CN202510026194.0
申请日:2025-01-08
Applicant: 中国科学院计算技术研究所
IPC: G06F15/177 , G06N5/01 , G06F9/50
Abstract: 本发明的实施例提供了一种用于多芯粒的可重构存内计算加速器的布局方法,包括:获取与布局相关的加速器参数和应用程序的应用参数;根据加速器参数和应用参数,将应用程序中的算子转换为加速器支持的功能,得到应用程序所需的各功能及其数量;模拟将每个功能独立配置到加速器的单个芯粒上,得到初始布局;多次执行预设优化方式以迭代优化布局,得到布局结果,包括:执行粗粒度优化操作,其包括:使用模拟退火算法对输入的布局进行迭代优化,优化时的扰动方式是随机交换其中两个芯粒上配置的功能,优化函数为基于布局计算的各芯粒间总的数据传输开销;执行功能整合操作,其包括:基于加速器参数尝试对粗粒度优化操作优化后的布局进行功能整合。
-
公开(公告)号:CN118394706A
公开(公告)日:2024-07-26
申请号:CN202410446460.0
申请日:2024-04-15
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种应用于图挖掘加速的存储器,存储器用于存储以数组表示的一个或多个图数据集,每个图数据集包括多个顶点且每个顶点设置有对应的编号,其中,数组反映了图数据集中的每个顶点与其他顶点之间的连接关系,所述存储器包括全局行缓冲器和多个子阵列,其中:所述多个子阵列被配置为基于各自的子阵列控制器的激活信号同时激活并同时将各自存储的图数据传输至各自对应的子阵列行缓冲器;所述多个子阵列还被配置为,在同时激活后,根据图挖掘需求,其中一个子阵列控制器输出选通信号选通对应子阵列行缓冲器到全局行缓冲器之间的通路,以控制对应的子阵列行缓冲器传输其上的图数据至全局行缓冲器。
-
公开(公告)号:CN118053461A
公开(公告)日:2024-05-17
申请号:CN202410234410.6
申请日:2024-03-01
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种多模式硬件单元和可重构阵列电路,一种多模式硬件单元,该多模式硬件单元用于构建可重构阵列电路或者处理器,所述多模式硬件单元能被配置为多种模式中的任意一种模式,且在被配置为一种模式后还能被重构配置为其他模式,其中,所述多种模式包括:第一模式,多模式硬件单元被配置为用于行使查找表功能的可编程逻辑单元;第二模式,多模式硬件单元被配置为用于行使路由功能的互联单元;以及第三模式,多模式硬件单元被配置为用于行使块内存功能的嵌入式BRAM。本发明的技术方案可以按需指定对应的多模式硬件单元作为嵌入式BRAM,满足应用需要的缓存需求,并降低读写时延;可以更好地满足密集型应用的访存需要。
-
公开(公告)号:CN117852589A
公开(公告)日:2024-04-09
申请号:CN202311818871.X
申请日:2023-12-27
Applicant: 中国科学院计算技术研究所
IPC: G06N3/0464 , G06N3/063 , G06N3/126 , G06N5/04
Abstract: 本发明提供了一种用于加速卷积神经网络推理的存内加速器,所述存内加速器包括全局内存、片上路由以及与全局内存相连的多个核心,每个核心包括:控制单元,用于获取指令流,基于指令流控制各个单元执行对应的操作,其中,指令流包括:计算操作和访存操作;本地内存单元,用于执行访存操作,根据滑窗的大小按顺序访问全局内存中卷积神经网络的输入数据,以得到计算操作对应的输入数据,并将对应的输入数据发送至存内计算矩阵单元;存内计算矩阵单元,其包括多个存内计算阵列,每个存内计算阵列用于执行所述计算操作,根据计算操作对应的输入数据进行矩阵‑向量乘法计算;向量功能单元,用于执行计算操作,根据矩阵‑向量乘法计算的结果进行后处理。
-
公开(公告)号:CN118331923A
公开(公告)日:2024-07-12
申请号:CN202410446459.8
申请日:2024-04-15
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种用于加速图挖掘的装置以及加速图挖掘的方法,所述装置包括:存内计算模块,用于根据访问的图数据进行图挖掘;第一存储介质,作为缓存,用于存储被设为复用的图数据;第二存储介质,作为加速器,其被存内计算模块访问的速度较第一存储介质更快,其数据位被配置为存储复用的图数据的头信息;控制模块,用于在存内计算模块需要访问图数据时,先查询需要访问的图数据的头信息是否存储在第二存储介质中,若是,根据查询得到的头信息从第一存储介质中读取对应的图数据供存内计算模块使用。
-
-
-
-
-
-
-
-
-