-
公开(公告)号:CN114153562B
公开(公告)日:2024-06-04
申请号:CN202111440847.8
申请日:2021-11-30
Applicant: 上海交通大学
IPC: G06F9/455
Abstract: 本发明公开了基于事件驱动的可重构空间阵列的仿真建模平台及方法,涉及空间阵列的快速、精确仿真领域领域,所述平台包括:以事件驱动为引擎;通过模块设计与通信接口实现的解耦,将所述仿真建模平台搭建成为模块的组合方式实现,通过参数化、桩替代实现不同的模块不同硬件参数的快速迭代,同时测试不同硬件通信机制的性能表现。本发明通过构建可扩展的事件驱动仿真框架,来解决架构探索中模拟平台与设计耦合度高,修改复杂的问题;与传统异构阵列模拟器相比,在相同应用架构下,应用事件驱动下模块化的仿真平台进行模拟仿真在debug模式下可以获得平均89%的仿真速度提升,在release模式下可以获得平均529%的仿真速度提升。
-
公开(公告)号:CN113821981A
公开(公告)日:2021-12-21
申请号:CN202111171756.9
申请日:2021-10-08
Applicant: 上海交通大学
Abstract: 本发明公开了一种卷积神经网络数据流设计空间分析工具的构建方法和装置,结合硬件特征与计算资源和存储资源的限制,构建面向阵列处理结构的卷积网络数据流设计空间探索方法,为在空间式阵列处理结构上映射卷积神经网络算法提供指导方向。
-
公开(公告)号:CN112463717A
公开(公告)日:2021-03-09
申请号:CN202011221019.0
申请日:2020-11-05
Applicant: 上海交通大学
IPC: G06F15/78
Abstract: 本发明公开了一种粗粒度可重构架构下条件分支实现方法,涉及粗粒度可重构架构领域,在CGRA线上的数据流包括数据位和分支位,首先进行分支发散,然后根据条件判断确定分支位,根据分支位确定分支是否执行,最后进行分支合并。本发明基于发散汇聚的分支实现方法,解决粗粒度可重构处理阵列分支执行能力不足的问题,采用多种发散方式优化嵌套分支的执行,解决嵌套分支执行的控制流复杂的问题,本发明的条件分支实现方法,性能得到提高,功耗显著降低。
-
公开(公告)号:CN111475205A
公开(公告)日:2020-07-31
申请号:CN202010135772.1
申请日:2020-03-02
Applicant: 上海交通大学 , 上海航天计算机技术研究所
IPC: G06F9/38 , G06F12/1027
Abstract: 本发明公开了一种基于数据流解耦合的粗粒度可重构阵列结构设计方法以及解耦合单元,涉及计算机协处理器加速领域,通过对造成静态CGRA中流水线停顿的数据流耦合现象归纳为访存、控制等因素导致的数据流速率不同而产生的互相影响,进行解耦合并设计解耦合单元,将其插入不同区域间耦合交互的位置,并将其作为统一的内存访问接口,优化了不同形式的流水线停顿,提高了CGRA的性能和资源利用率。
-
公开(公告)号:CN116627379A
公开(公告)日:2023-08-22
申请号:CN202310585437.5
申请日:2023-05-23
Applicant: 上海交通大学
IPC: G06F7/487
Abstract: 本发明提供了一种可重构的支持多精度浮点或定点运算的方法及系统,能够完成多路并行的浮点或定点低精度运算,也可以整体实现一个高精度的浮点或定点运算。相比于现阶段已经提出的运算单元,本发明面向神经网络中的训练和推断、已经多种数据密集型应用的多精度、多规格的计算需求,在粗粒度可重构阵列的数据位宽首先得前提下,设计支持多精度及混合精度定/浮点操作的高能效、低延迟、低面积开销运算单元;统一浮点与定点数据通路,以更小的资源开销同时支持更多样化的计算模式,避免了在处理单元中独立放置浮点和定点计算引擎后,面向不同计算需求时资源浪费的问题,大幅提升可重构阵列的混合精度运算性能。
-
公开(公告)号:CN111475205B
公开(公告)日:2023-03-17
申请号:CN202010135772.1
申请日:2020-03-02
Applicant: 上海交通大学 , 上海航天计算机技术研究所
IPC: G06F9/38 , G06F12/1027
Abstract: 本发明公开了一种基于数据流解耦合的粗粒度可重构阵列结构设计方法以及解耦合单元,涉及计算机协处理器加速领域,通过对造成静态CGRA中流水线停顿的数据流耦合现象归纳为访存、控制等因素导致的数据流速率不同而产生的互相影响,进行解耦合并设计解耦合单元,将其插入不同区域间耦合交互的位置,并将其作为统一的内存访问接口,优化了不同形式的流水线停顿,提高了CGRA的性能和资源利用率。
-
公开(公告)号:CN112612744B
公开(公告)日:2022-11-25
申请号:CN202011471974.X
申请日:2020-12-14
Applicant: 上海交通大学
Abstract: 本发明公开了一种基于数据流解耦的可重构阵列映射方法,涉及可重构阵列的映射布局领域,首先,在原始DFG(Data Flow Graph,数据流图)中执行速率失配的区域间加入DE(Decouple Element,解耦单元),对数据流进行解耦;其次,利用一种“局部紧密,全局稀疏”的分簇式互连结构,将解耦后的所述数据流分隔在若干个规则的互连区域内;最后,通过一种分布式多阶段的布局算法,对每块所述互连区域内的所述数据流进行物理布局。本发明可以提高阵列的执行效率,完成了各种类型的单元的高效映射,并提升布局的速度和质量。
-
公开(公告)号:CN115081608A
公开(公告)日:2022-09-20
申请号:CN202210750313.3
申请日:2022-06-29
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于自适应分配的神经网络加速器实现系统和方法,包括:模块M1:构建激活与权重双数据位加速器的整体架构,包括DRAM与数据加载模块、写回模块、片上缓存模块、有效项生成单元和计算阵列,以及各模块间的连接关系;模块M2:构建激活数据和权重数据有效项表达方式,以及根据该表达方式构建激活数据和权重数据有效项生成单元和移位累加运算单元;模块M3:确定计算阵列中的数据流组织方式,进行数据分组和同步,构建权重数据组合位有效项表达方式。本发明在对激活数据和权重数据进行有效位检测后,通过权重数据组合位有效项的表示方法,减少双数据位串行计算时的有效项个数,缩短了计算周期。
-
公开(公告)号:CN114153562A
公开(公告)日:2022-03-08
申请号:CN202111440847.8
申请日:2021-11-30
Applicant: 上海交通大学
IPC: G06F9/455
Abstract: 本发明公开了基于事件驱动的可重构空间阵列的仿真建模平台及方法,涉及空间阵列的快速、精确仿真领域领域,所述平台包括:以事件驱动为引擎;通过模块设计与通信接口实现的解耦,将所述仿真建模平台搭建成为模块的组合方式实现,通过参数化、桩替代实现不同的模块不同硬件参数的快速迭代,同时测试不同硬件通信机制的性能表现。本发明通过构建可扩展的事件驱动仿真框架,来解决架构探索中模拟平台与设计耦合度高,修改复杂的问题;与传统异构阵列模拟器相比,在相同应用架构下,应用事件驱动下模块化的仿真平台进行模拟仿真在debug模式下可以获得平均89%的仿真速度提升,在release模式下可以获得平均529%的仿真速度提升。
-
公开(公告)号:CN113723044A
公开(公告)日:2021-11-30
申请号:CN202111061410.3
申请日:2021-09-10
Applicant: 上海交通大学
IPC: G06F30/392 , G06N3/063
Abstract: 本发明公开了一种基于数据稀疏性的超额行激活存算一体加速器设计,涉及存算一体架构的神经网络加速器设计领域,包括三部分,构建基于行激活数据的预测机制,建模外围电路器件限制与计算并行度,解决所述外围电路与所述计算并行度的匹配问题;构建行激活超额订阅机制,自适应地调整所述计算并行度和资源使用,解决稀疏数据下计算阵列和所述外围电路利用率低,资源冗余的问题;针对神经网络数据稀疏性的特点,重新规划控制流和数据流,解决了利用数据稀疏性而引入的复杂电路设计的问题。本发明通过预测输出数据规模,建模外围电路器件限制与计算并行度关系,根据预测自适应地调整计算并行度和资源使用,以最大程度利用外围电路资源。
-
-
-
-
-
-
-
-
-