-
公开(公告)号:CN117311663A
公开(公告)日:2023-12-29
申请号:CN202311305768.5
申请日:2023-10-10
Applicant: 南京大学
IPC: G06F7/498 , G06N3/063 , G06N3/0464 , G06N3/045 , G06N3/0475 , G06N3/094
Abstract: 本发明公开了一种基于神经网络激活分布的可重构近似乘累加单元,具体包括乘法模块,包括:编码器,将神经网络的激活输入和权重输入进行radix‑8 booth编码,生成对应的部分积选择信号;部分积生成器,根据部分积选择信号,生成部分积;第一加法器,将部分积按照从上到下的顺序进行累加,得到乘法结果;加法模块,包括:分类器,根据所述乘法结果的高位进行分类,分为大数和小数;压缩器,将大数进行精确压缩,将小数进行近似压缩;第二加法器,将压缩结果通过第二加法器相加,得到卷积结果。本发明在不损失太多精度的前提下有效地减少神经网络中计算单元的功耗和延时,并且能够动态的适应不同的网络类型,有着良好的实际应用价值。
-
公开(公告)号:CN117236248A
公开(公告)日:2023-12-15
申请号:CN202311257300.3
申请日:2023-09-27
Applicant: 南京大学
IPC: G06F30/337 , G06F30/33
Abstract: 本发明公开了一种多FPGA系统下多资源约束的自适应图划分方法,具体包括应用平衡划分算法获得图划分初始解;使用结点资源微调算法对初始解的结点划分进行微调,获得满足资源约束的划分解;确定细粒度参数,将满足资源约束的划分解的各子集的结点粗化为超结点,获得超结点图;使用超结点转移算法对所述超结点图调整超结点的分区,获得调整后的超结点图;根据调整后的超结点图,将超结点映射回原始结点,获得调整后的划分解。本发明通过初始解的调整及移动结点时的资源约束考虑,可以得到满足约束的合理划分;除此之外,本发明采用的是多规模迭代粗化调整的策略,因此能够得到灵活分区的划分,尽可能减少分区间所连接的线网数,提高系统频率。
-
公开(公告)号:CN117236398A
公开(公告)日:2023-12-15
申请号:CN202311256510.0
申请日:2023-09-27
Applicant: 南京大学
IPC: G06N3/065 , G06N3/048 , G06N3/047 , G06N3/0985
Abstract: 本发明公开了一种基于人工神经网络的片上网络延时预测器,包括收集随机硬件映射和与其对应的网络特征值,将硬件映射和网络特征值组成数据集;根据所述数据集设置片上网络延时预测模型的网络结构与训练参数;使用K折交叉验证法训练片上网络延时预测模型,得到模型的最优超参数;使用最优超参数在所有训练数据上重新训练片上网络延时预测模型,得到最终的片上网络延时预测模型;评估最终的片上网络延时预测模型在测试集上的泛化能力。本发明可在使用穷举、启发式、迭代算法探索最优映射时替代片上网络仿真器,快速得到不同输入硬件映射对应所需的延迟时间,辅助最优映射探索,计算成本较低,具有较好的泛化能力与较强的鲁棒性。
-
公开(公告)号:CN119961208A
公开(公告)日:2025-05-09
申请号:CN202510120212.1
申请日:2025-01-25
Applicant: 南京大学
IPC: G06F15/78 , G06F15/173 , G06F15/80
Abstract: 本发明公开了一种基于三维片上网络的公平仲裁互补转向路由方法,属于片上网络通信领域,其技术方案要点包括,根据仲裁机制确定第一节点的输出端口,第一节点包括多个输出端口,每个输出端口与一第二节点对应;根据第一节点所处的路由层的转向模型,判断输出端口对应的转向方向是否为转向模型限定的其中一个转向方向;若否,将待发送数据发送至相邻路由层上的其中一个路由节点,其中,相邻路由层上的其中一个路由节点接收待发送数据后形成第二节点,本发明通过互补层的设计与仲裁决策的结合,可以进一步提高自适应路由方法的拥塞规避性能以及网络中通信流量的均匀分布,最终达到提高三维片上网络的通信性能和可靠性的目的。
-
-
-