-
公开(公告)号:CN102323918A
公开(公告)日:2012-01-18
申请号:CN201110242061.5
申请日:2011-08-22
Applicant: 清华大学
IPC: G06F15/78
Abstract: 本申请提供了一种动态可重构处理单元阵列扩展的方法,涉及嵌入式系统领域中的动态可重构处理器技术领域。所述的方法包括:根据基础的处理单元阵列的行数a和列数b确定处理单元阵列扩展后的行数m和列数n,其中a<m,b<n;将基础a×b处理单元阵列扩展成m×n处理单元阵列;根据扩展后的m×n处理单元阵列对路由单元、内部数据读入装置、内部数据写出装置、时序控制单元和处理单元阵列的配置信息进行相应调整。通过本申请能将基础处理器单元阵列扩展至更宽更深的处理器单元阵列,使动态可重构处理器的计算宽度和深度大大增加,有利于性能的优化,能满足更大量的数据处理过程。
-
公开(公告)号:CN102323916A
公开(公告)日:2012-01-18
申请号:CN201110159481.7
申请日:2011-06-14
Applicant: 清华大学
IPC: G06F15/163
Abstract: 本发明提供了一种动态可重构处理器间一对一数据交互方法及装置,涉及嵌入式系统领域。所述的方法包括:1.第一动态可重构处理器的子单元的数据通过第一动态可重构处理器的主交互接口写入第二动态可重构处理器的数据交互存储器;2.第二动态可重构处理器的处理器间数据交互装置读取本处理器内数据交互存储器里存储的数据至第二动态可重构处理器的子单元。本发明的结构包括在两个动态可重构处理器里各增加一个主交互接口和数据交互存储器,其中,每个动态可重构处理器的主交互接口连接另外一个动态可重构处理器的数据交互存储器。通过本发明,提高了动态可重构处理器的数据处理速度和数据的并行效率。
-
公开(公告)号:CN102279729A
公开(公告)日:2011-12-14
申请号:CN201110159501.0
申请日:2011-06-14
Applicant: 清华大学
IPC: G06F9/34
Abstract: 本发明公开了一种动态可重构阵列调用配置信息的方法、缓存器和处理器,方法包括:子单元向处理单元阵列配置信息缓存器发出配置信息请求;按照所述配置信息请求,在所述处理单元阵列配置信息缓存器内查找到一定时间内调用过的配置信息;将所述配置信息反馈到所述子单元。本发明还提供一种用于动态可重构处理器的处理单元阵列配置信息缓存器以及动态可重构处理器。由于缓存器内存储子单元存储着在一定时间内调用的配置信息,只有在处理单元阵列配置信息高速缓存器内没有找到配置信息时,才会到处理单元阵列配置信息存储器内获得配置信息,从而提高了配置信息的调用效率,缩短了调用时间。
-
公开(公告)号:CN102253920A
公开(公告)日:2011-11-23
申请号:CN201110152239.7
申请日:2011-06-08
Applicant: 清华大学
IPC: G06F15/173
Abstract: 本发明提供了一种全互联路由结构动态可重构数据处理方法和处理器。所述的方法包括:步骤101、输入一个周期的待处理数据;步骤102、将输入的每个待处理数据由每个路由单元按分配编码方法接收数据,输送到与每个路由单元相配的计算单元进行处理;步骤103、将处理完毕的数据通过提取编码方法提取所需数据;步骤104、将所述提取的数据输出。所述的处理器包括输入FIFO,动态可重构阵列;动态可重构阵列,包括阵2m×2k列单元,所述的阵列单元包括路由单元和计算单元,每个路由单元连接输入FIFO;动态可重构阵列按列排列形成一维环状结构;输出FIFO,连接输出路由,用于将所述提取的数据输出。通过本发明提高了处理器带宽和数据运行效率。
-
-
公开(公告)号:CN102207892A
公开(公告)日:2011-10-05
申请号:CN201110140356.1
申请日:2011-05-27
Applicant: 清华大学
IPC: G06F9/52
Abstract: 本发明提出了一种动态可重构处理器内子单元间进行同步的方法,在子单元配置字缓存器非空且之前配置字执行完,判定同步控制器的使能信号为真,配置字缓存器弹出首个配置字,配置字中同步信息发送到子单元同步控制器,配置字中的配置信息发送到子单元,子单元同步控制器接受同步信息,并判定是否要同步:若是则待需同步的多个子单元都已执行到同步任务,且都已执行完时,子单元同步控制器返回使能信号为真;若否则向子单元配置字缓存器返回使能信号为真;子单元接受配置字中的配置信息后,对配置字所对应的子任务进行检测,若子任务完成,则告知子单元配置字缓存器任务执行完毕,从而完成可重构处理器内多个子单元之间的同步任务。
-
公开(公告)号:CN102207852A
公开(公告)日:2011-10-05
申请号:CN201110140360.8
申请日:2011-05-27
Applicant: 清华大学
Abstract: 本发明提供了一种动态可重构处理器内子单元间进行数据交互的系统和方法,在动态可重构处理器器中增加了子单元间数据交互暂存器、内部数据写出装置、子单元间数据交互装置,某一子单元运行完毕时产生的结果数据,其他的子单元以及该子单元需要这个结果数据时,通过内部数据写出装置把该子单元的结果数据写出到子单元间数据交互暂存器,再通过子单元间数据交互装置把需要的结果数据写入目的子单元(需要结果数据的子单元)内部的数据存储器,从而实现了处理器并行处理时各个独立子单元之间的数据交互。
-
公开(公告)号:CN102207850A
公开(公告)日:2011-10-05
申请号:CN201110140266.2
申请日:2011-05-27
Applicant: 清华大学
Abstract: 本发明提供了一种动态可重构处理器的层次化执行配置流的方法,层次化的配置信息与应用算法的层次化划分一一对应,保证一个完整的应用算法在动态可重构处理器上正确的映射,层次化的配置信息可对配置信息的信息量进行压缩,减少配置信息在处理器内存储时的空间。
-
公开(公告)号:CN102184090A
公开(公告)日:2011-09-14
申请号:CN201110140376.9
申请日:2011-05-27
Applicant: 清华大学
IPC: G06F9/34
Abstract: 本发明提供了一种动态可重构处理器及其固定数的调用方法,所述动态可重构处理器包括与所述处理单元阵列连接的不变固定数寄存器和可变固定数寄存器,其中,所述不变固定数寄存器与不变固定数组存储器相连接,所述可变固定数寄存器与可变固定数组存储器相连接;所述处理单元阵列根据配置信息从所述不变固定数寄存器提取所需的不变固定数;和/或,从所述可变固定数寄存器提取所需的可变固定数。本发明可以在尽可能减小片内存储面积的情况下,提高调用效率,以实现固定数的高速读取。
-
公开(公告)号:CN120030370A
公开(公告)日:2025-05-23
申请号:CN202411937200.X
申请日:2024-12-26
Applicant: 清华大学
IPC: G06F18/231 , G06N5/04 , G06N3/08
Abstract: 本发明公开了一种面向可编程交换机的高效聚合方法及装置,包括:获取训练完成的神经网络模型和用于训练神经网络模型的训练数据集;基于训练数据集中的训练数据,生成神经网络模型对应的第一二叉聚类树;确定训练完成的神经网络模型中的卷积核参数/全连接层参数;基于第一二叉聚类树和卷积核参数/全连接层参数,得到对应至少一个加权值向量;将至少一个加权值向量存储到对应的至少一个第一查找表,并将至少一个第一查找表高效部署在可编程交换机中,基于可编程交换机进行高效聚合得到推理结果。本发明支持更大规模的神经网络,适用范围广泛,并将神经网络模型中矩阵乘法和卷积操作抽象为可编程交换机中高效聚合操作,减少了模型推理时间。
-
-
-
-
-
-
-
-
-