-
公开(公告)号:CN115550235A
公开(公告)日:2022-12-30
申请号:CN202211014355.7
申请日:2022-08-23
Applicant: 南京大学
IPC: H04L45/00 , H04L45/586 , H04L45/60
Abstract: 本发明公开一种面向神经网络平台的单周期路由器,属于片上网络技术领域。本发明基于XY维序路由算法,根据切片可能前往的输出方向为不同端口的输入缓冲区分配异构的虚通道;在路由器中设有虚通道标识更新单元,通过虚通道标识更新提前判断切片在下一跳路由写入的虚通道即下一跳路由的输出方向,并更新其通道标识位,该逻辑时序开销隐藏在切片的线传输延时中。本发明通过对不同向通信流量的异构处理,简化了仲裁单元的数量和结构,降低了仲裁逻辑的时序开销,优化了路由流水线,有效降低片上网络的通信延时,改善网络扩展带来的延时上升情况,实现了单切片快速通行的方案,具有良好的使用价值和广泛的应用前景。
-
公开(公告)号:CN115550235B
公开(公告)日:2024-02-09
申请号:CN202211014355.7
申请日:2022-08-23
Applicant: 南京大学
IPC: H04L45/00 , H04L45/586 , H04L45/60
Abstract: 本发明公开一种面向神经网络平台的单周期路由器,属于片上网络技术领域。本发明基于XY维序路由算法,根据切片可能前往的输出方向为不同端口的输入缓冲区分配异构的虚通道;在路由器中设有虚通道标识更新单元,通过虚通道标识更新提前判断切片在下一跳路由写入的虚通道即下一跳路由的输出方向,并更新其通道标识位,该逻辑时序开销隐藏在切片的线传输延时中。本发明通过对不同向通信流量的异构处理,简化了仲裁单元的数量和结构,降低了仲裁逻辑的时序开销,优化了路由流水线,有效降低片上网络的通信延时,改善网络扩展带来的延时上升情况,实现了单切片快速通行的方案,具有良好的使用价值和广泛的应用前景。
-
公开(公告)号:CN117311663A
公开(公告)日:2023-12-29
申请号:CN202311305768.5
申请日:2023-10-10
Applicant: 南京大学
IPC: G06F7/498 , G06N3/063 , G06N3/0464 , G06N3/045 , G06N3/0475 , G06N3/094
Abstract: 本发明公开了一种基于神经网络激活分布的可重构近似乘累加单元,具体包括乘法模块,包括:编码器,将神经网络的激活输入和权重输入进行radix‑8 booth编码,生成对应的部分积选择信号;部分积生成器,根据部分积选择信号,生成部分积;第一加法器,将部分积按照从上到下的顺序进行累加,得到乘法结果;加法模块,包括:分类器,根据所述乘法结果的高位进行分类,分为大数和小数;压缩器,将大数进行精确压缩,将小数进行近似压缩;第二加法器,将压缩结果通过第二加法器相加,得到卷积结果。本发明在不损失太多精度的前提下有效地减少神经网络中计算单元的功耗和延时,并且能够动态的适应不同的网络类型,有着良好的实际应用价值。
-
公开(公告)号:CN117076380A
公开(公告)日:2023-11-17
申请号:CN202311043803.0
申请日:2023-08-18
Applicant: 南京大学
IPC: G06F15/173 , G06N3/063
Abstract: 本发明公开了一种面向基于片上网络的神经网络加速器的同步感知仲裁模块,包括优先级产生模块,集成在处理单元中,接收数据包发送有效信号,根据处理单元的剩余数据包数目为数据包分配优先级,生成对应的层标识;同步感知仲裁模块,集成在路由器中,接收数据包携带的优先级和层标识,进行层间通信同步感知仲裁。本发明针对基于片上网络的神经网络加速器中由多对一和多对多流量带来的通信同步问题,通过相邻层数据包的同步感知优先级仲裁实现了对源节点的反压调控,通过负反馈机制动态调节各个源节点的发包速率,实现层与层之间的通信同步,减小了层与层之间的传输延迟,并最终减少了神经网络的总推理时间。
-
-
-