-
公开(公告)号:CN119645344A
公开(公告)日:2025-03-18
申请号:CN202411671575.6
申请日:2024-11-21
Applicant: 南京大学
Abstract: 本发明公开了一种用于神经网络的近似乘法器实现方法及近似乘法器,其技术方案要点是包括,输入第一操作数和第二操作数,将第一操作数拆分为低位部分和高位部分;对低位部分进行第一编码,得到多组第一编码数,并对高位部分进行第二编码,得到多组第二编码数;将多组第一编码数和多组第二编码数组装,形成组装操作数;根据组装操作数和第二操作数,生成部分积矩阵和对应部分积矩阵的截断误差补偿值;基于部分积矩阵和截断误差补偿值,生成第一操作数和第二操作数的近似乘法结果,本发明将近似高基编码与截断补偿结合使用,在保证计算精度和最终网络推理精度的前提下,大幅提升了近似乘法器的性能。
-
公开(公告)号:CN117236248A
公开(公告)日:2023-12-15
申请号:CN202311257300.3
申请日:2023-09-27
Applicant: 南京大学
IPC: G06F30/337 , G06F30/33
Abstract: 本发明公开了一种多FPGA系统下多资源约束的自适应图划分方法,具体包括应用平衡划分算法获得图划分初始解;使用结点资源微调算法对初始解的结点划分进行微调,获得满足资源约束的划分解;确定细粒度参数,将满足资源约束的划分解的各子集的结点粗化为超结点,获得超结点图;使用超结点转移算法对所述超结点图调整超结点的分区,获得调整后的超结点图;根据调整后的超结点图,将超结点映射回原始结点,获得调整后的划分解。本发明通过初始解的调整及移动结点时的资源约束考虑,可以得到满足约束的合理划分;除此之外,本发明采用的是多规模迭代粗化调整的策略,因此能够得到灵活分区的划分,尽可能减少分区间所连接的线网数,提高系统频率。
-
公开(公告)号:CN117236398A
公开(公告)日:2023-12-15
申请号:CN202311256510.0
申请日:2023-09-27
Applicant: 南京大学
IPC: G06N3/065 , G06N3/048 , G06N3/047 , G06N3/0985
Abstract: 本发明公开了一种基于人工神经网络的片上网络延时预测器,包括收集随机硬件映射和与其对应的网络特征值,将硬件映射和网络特征值组成数据集;根据所述数据集设置片上网络延时预测模型的网络结构与训练参数;使用K折交叉验证法训练片上网络延时预测模型,得到模型的最优超参数;使用最优超参数在所有训练数据上重新训练片上网络延时预测模型,得到最终的片上网络延时预测模型;评估最终的片上网络延时预测模型在测试集上的泛化能力。本发明可在使用穷举、启发式、迭代算法探索最优映射时替代片上网络仿真器,快速得到不同输入硬件映射对应所需的延迟时间,辅助最优映射探索,计算成本较低,具有较好的泛化能力与较强的鲁棒性。
-
公开(公告)号:CN119443280A
公开(公告)日:2025-02-14
申请号:CN202411565459.6
申请日:2024-11-05
Applicant: 南京大学
IPC: G06N5/04 , H04L49/109 , G06F15/78
Abstract: 本发明公开了基于协同近似策略的片上网络AI推理系统、方法及设备,属于片上网络通信技术领域,其技术方案要点是包括至少一个第一近似处理核心和至少一个第二近似处理核心;第一近似处理核心用于对当前分配的计算任务单元进行近似计算得到近似计算结果并生成原始数据包,并根据近似计算与非近似计算的算法误差,对原始数据包进行截位处理,得到近似数据包,最后将近似数据包通过对应的路由单元,发送至接收该近似数据包的处理核心对应的路由单元;第二近似处理核心用于接收一近似数据包,并根据近似数据包的头包信息,对近似数据包进行数据恢复,得到恢复数据包,本发明采用协同近似策略,在极低的推理精度损失下,最大程度保证了能效的提升。
-
公开(公告)号:CN117311663A
公开(公告)日:2023-12-29
申请号:CN202311305768.5
申请日:2023-10-10
Applicant: 南京大学
IPC: G06F7/498 , G06N3/063 , G06N3/0464 , G06N3/045 , G06N3/0475 , G06N3/094
Abstract: 本发明公开了一种基于神经网络激活分布的可重构近似乘累加单元,具体包括乘法模块,包括:编码器,将神经网络的激活输入和权重输入进行radix‑8 booth编码,生成对应的部分积选择信号;部分积生成器,根据部分积选择信号,生成部分积;第一加法器,将部分积按照从上到下的顺序进行累加,得到乘法结果;加法模块,包括:分类器,根据所述乘法结果的高位进行分类,分为大数和小数;压缩器,将大数进行精确压缩,将小数进行近似压缩;第二加法器,将压缩结果通过第二加法器相加,得到卷积结果。本发明在不损失太多精度的前提下有效地减少神经网络中计算单元的功耗和延时,并且能够动态的适应不同的网络类型,有着良好的实际应用价值。
-
公开(公告)号:CN119961208A
公开(公告)日:2025-05-09
申请号:CN202510120212.1
申请日:2025-01-25
Applicant: 南京大学
IPC: G06F15/78 , G06F15/173 , G06F15/80
Abstract: 本发明公开了一种基于三维片上网络的公平仲裁互补转向路由方法,属于片上网络通信领域,其技术方案要点包括,根据仲裁机制确定第一节点的输出端口,第一节点包括多个输出端口,每个输出端口与一第二节点对应;根据第一节点所处的路由层的转向模型,判断输出端口对应的转向方向是否为转向模型限定的其中一个转向方向;若否,将待发送数据发送至相邻路由层上的其中一个路由节点,其中,相邻路由层上的其中一个路由节点接收待发送数据后形成第二节点,本发明通过互补层的设计与仲裁决策的结合,可以进一步提高自适应路由方法的拥塞规避性能以及网络中通信流量的均匀分布,最终达到提高三维片上网络的通信性能和可靠性的目的。
-
公开(公告)号:CN119474000A
公开(公告)日:2025-02-18
申请号:CN202411507882.0
申请日:2024-10-28
Applicant: 南京大学
IPC: G06F15/78 , G06F15/173 , G06F7/544 , G06N3/063 , G06N3/0464
Abstract: 本发明涉及近似片上网络技术领域,公开了一种面向卷积神经网络加速的高实时性近似片上网络,结合神经网络的数据分布情况,提出基于数据分级的近似压缩和分段恢复方案,实现在降低通信开销的同时,保持神经网络推理精度;并提出一个质量控制模型,该模型能够快速搜索出满足质量损失约束的神经网络各层阈值,确保网络在进行近似通信的同时保持准确性;进一步提出基于拥塞感知的阈值动态调整方案,通过感知网络中的拥塞情况,动态调整每一层的近似阈值,以实现对数据压缩率的实时优化,从而有效缓解通信网络中的拥塞问题;结合近似通信后网络中的激活数据分布特征,优化计算阵列中的近似计算模块,提升计算阵列的整体效率,实现计算加速。
-
-
-
-
-
-