-
公开(公告)号:CN119065832A
公开(公告)日:2024-12-03
申请号:CN202411019358.9
申请日:2024-07-29
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种面向数据流众核处理器的任务运行时调度方法及装置,该方法包括在运行时环境中执行以下操作:根据PE阵列的剩余资源、片上存储空间剩余资源和各任务的属性信息,从任务发射队列中标记资源适配的任务以构建任务组;对任务组中的任务进行预处理,得到经预处理的任务组,将经预处理的任务组映射到PE阵列上执行,其中,所述预处理包括:识别任务组中具有数据依赖的两个任务构成的关联对,修改关联对中前驱任务和后继任务所对应的微指令代码,以使处理该前驱任务的PE核将结果数据直接传输至处理该后继任务的PE核。
-
公开(公告)号:CN114860319A
公开(公告)日:2022-08-05
申请号:CN202210518572.3
申请日:2022-05-12
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种用于SIMD计算指令的运算装置,包括:数据打包流水寄存器,用于接收并寄存待处理SIMD计算指令以及指令对应的一组操作数;定点译码器,用于对定点整型指令对应的操作数进行译码重排处理并传输到定点整型运算器;定点整型运算器;用于对定点译码器处理后的操作数执行整型运算;浮点译码器,用于对浮点指令对应的操作数进行译码重排处理并根据指令将重排后的操作数传送到浮点乘加器或浮点除法器;浮点乘加器,用于对浮点译码器处理后的操作数进行浮点乘加计算;浮点除法器,用于对浮点译码器处理后的操作数进行浮点除法计算;运算结果仲裁器,用于对计算部件的运算结果进行选择以输出最终SIMD计算结果。
-
公开(公告)号:CN110890120B
公开(公告)日:2021-08-31
申请号:CN201911001197.X
申请日:2019-10-21
Applicant: 中国科学院计算技术研究所
IPC: G11C13/00
Abstract: 本发明提出一种基于阻变存储器的通用区块链应用处理加速方法及系统,包括:判断当前程序是否为区块链加速处理程序,若是,则将当前程序发送至包括存储处理器和阻变存储器的HMC存储器端,其中存储处理器集成在HMC存储器端的逻辑控制层,阻变存储器集成在HMC存储器端的立体存储层,存储处理器通过控制立体存储层,以数据流运行的方式完成对当前程序的近存储计算,得到当前程序的执行结果,并将其回传至主处理器端,否则主处理端中的乱序核根据当前程序,以控制流运行的方式执行当前程序,得到执行结果。本发明具有较高的执行速度和显著的能效比提升,并结合数据流任务分配和执行模式,能够获得更高的执行效率和能效。
-
公开(公告)号:CN114610138B
公开(公告)日:2023-08-08
申请号:CN202210230341.2
申请日:2022-03-10
Applicant: 中国科学院计算技术研究所
IPC: G06F1/3234 , G06F1/3206
Abstract: 提供一种带宽控制单元,其用于包括多个数据处理单元的处理器芯片,所述多个数据处理单元通过总线对存储器进行访问,所述存储器包括优先级管理单元,所述带宽控制单元包括:第一温度判断模块,其用于接收所述多个数据处理单元的温度值,以及将所述温度值分别与相应的数据处理单元的温度阈值进行比较,并输出第一比较结果;以及优先级处理模块,其用于接收所述第一比较结果,以及根据所述第一比较结果调整所述多个数据处理单元中的一个或者多个的访存优先级;其中,所述优先级处理模块将调整后的访存优先级输出至所述存储器的优先级管理单元,以控制所述多个数据处理单元访存所述存储器的带宽。
-
公开(公告)号:CN114637388A
公开(公告)日:2022-06-17
申请号:CN202210270118.0
申请日:2022-03-18
Applicant: 中国科学院计算技术研究所
IPC: G06F1/3287 , G06F1/3237 , G06F9/38
Abstract: 本申请提供了面向数据流处理器的功耗控制方法及装置,其根据待执行程序的数据流图,将各个指令映射至数据流处理器中的多个处理单元;根据映射至每个处理单元的各个指令的类型,确定执行各指令所需的运算部件;以及通过时钟门控技术激活所需的运算部件。该申请的方案基于数据流处理器执行模式的特点并借助于时钟门控技术,实现了更细粒度的功耗控制,提升了整体执行效能比。
-
公开(公告)号:CN111008133B
公开(公告)日:2021-04-27
申请号:CN201911205445.2
申请日:2019-11-29
Applicant: 中国科学院计算技术研究所
IPC: G06F11/36
Abstract: 本发明公开了一种粗粒度数据流架构执行阵列的调试装置,包括:执行阵列,包括多个执行单元,该执行单元根据程序的数据流图获取程序块,并根据调试命令对程序块进行断点调试以获取断点数据;该程序块为该程序以粗粒度进行划分的程序分块;处理器,用于生成该调试命令,并接收该断点数据;集中调试器,分别与该处理器和该执行阵列通讯连接,用于将该调试命令转发给对应的执行单元,以及将该断点数据转发给该处理器。
-
公开(公告)号:CN114860169A
公开(公告)日:2022-08-05
申请号:CN202210510935.9
申请日:2022-05-11
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种片上SRAM阵列存储装置,所述装置包括多个并列的bank块,每个bank块包括数量相同的连续的多个SRAM单元,每个SRAM单元包括连续的多行存储空间,不同bank块中的同一位置的SRAM单元组成一个SRAM单元行,其中,各个bank块中的各个SRAM单元按照如下方式进行编址:以第一个SRAM单元行中的第一个SRAM单元为起点进行顺序编址,以使相邻地址分散在不同bank块中;相邻SRAM单元行中,后一个SRAM单元行的第一个SRAM单元在前一个SRAM单元行的最后一个SRAM单元的地址的基础上顺序编址。
-
公开(公告)号:CN111459856B
公开(公告)日:2022-02-18
申请号:CN202010200676.0
申请日:2020-03-20
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种数据传输装置,包括:控制逻辑,其用于根据配置信息产生相应的控制信号以控制其他模块的动作;其中,存储体接口逻辑用于从存储体中读取数据或向存储体写入数据;第一选择逻辑用于选择与正向传输模式对应的数据传输路径或与反向传输模式对应的数据接收路径;数据对齐逻辑用于对传输的数据进行对齐操作;重组模块用于对传输的数据进行重组操作以将存储体中读出的数据块拆分成数据分量的形式并重组成新的数据块后传递给片上存储结构进行处理,或将片上存储结构处理后的数据块拆分成数据分量形式并重组成数据块写入存储体;第二选择逻辑用于选择与正向传输模式对应的数据接收路径或与反向传输模式对应的数据传输路径;数据路由逻辑用于确定数据传输的目的地址。
-
公开(公告)号:CN111459856A
公开(公告)日:2020-07-28
申请号:CN202010200676.0
申请日:2020-03-20
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种数据传输装置,包括:控制逻辑,其用于根据配置信息产生相应的控制信号以控制其他模块的动作;其中,存储体接口逻辑用于从存储体中读取数据或向存储体写入数据;第一选择逻辑用于选择与正向传输模式对应的数据传输路径或与反向传输模式对应的数据接收路径;数据对齐逻辑用于对传输的数据进行对齐操作;重组模块用于对传输的数据进行重组操作以将存储体中读出的数据块拆分成数据分量的形式并重组成新的数据块后传递给片上存储结构进行处理,或将片上存储结构处理后的数据块拆分成数据分量形式并重组成数据块写入存储体;第二选择逻辑用于选择与正向传输模式对应的数据接收路径或与反向传输模式对应的数据传输路径;数据路由逻辑用于确定数据传输的目的地址。
-
公开(公告)号:CN111008133A
公开(公告)日:2020-04-14
申请号:CN201911205445.2
申请日:2019-11-29
Applicant: 中国科学院计算技术研究所
IPC: G06F11/36
Abstract: 本发明公开了一种粗粒度数据流架构执行阵列的调试装置,包括:执行阵列,包括多个执行单元,该执行单元根据程序的数据流图获取程序块,并根据调试命令对程序块进行断点调试以获取断点数据;该程序块为该程序以粗粒度进行划分的程序分块;处理器,用于生成该调试命令,并接收该断点数据;集中调试器,分别与该处理器和该执行阵列通讯连接,用于将该调试命令转发给对应的执行单元,以及将该断点数据转发给该处理器。
-
-
-
-
-
-
-
-
-