多FPGA系统下多资源约束的自适应图划分方法

    公开(公告)号:CN117236248A

    公开(公告)日:2023-12-15

    申请号:CN202311257300.3

    申请日:2023-09-27

    申请人: 南京大学

    IPC分类号: G06F30/337 G06F30/33

    摘要: 本发明公开了一种多FPGA系统下多资源约束的自适应图划分方法,具体包括应用平衡划分算法获得图划分初始解;使用结点资源微调算法对初始解的结点划分进行微调,获得满足资源约束的划分解;确定细粒度参数,将满足资源约束的划分解的各子集的结点粗化为超结点,获得超结点图;使用超结点转移算法对所述超结点图调整超结点的分区,获得调整后的超结点图;根据调整后的超结点图,将超结点映射回原始结点,获得调整后的划分解。本发明通过初始解的调整及移动结点时的资源约束考虑,可以得到满足约束的合理划分;除此之外,本发明采用的是多规模迭代粗化调整的策略,因此能够得到灵活分区的划分,尽可能减少分区间所连接的线网数,提高系统频率。

    基于人工神经网络的片上网络延时预测器

    公开(公告)号:CN117236398A

    公开(公告)日:2023-12-15

    申请号:CN202311256510.0

    申请日:2023-09-27

    申请人: 南京大学

    摘要: 本发明公开了一种基于人工神经网络的片上网络延时预测器,包括收集随机硬件映射和与其对应的网络特征值,将硬件映射和网络特征值组成数据集;根据所述数据集设置片上网络延时预测模型的网络结构与训练参数;使用K折交叉验证法训练片上网络延时预测模型,得到模型的最优超参数;使用最优超参数在所有训练数据上重新训练片上网络延时预测模型,得到最终的片上网络延时预测模型;评估最终的片上网络延时预测模型在测试集上的泛化能力。本发明可在使用穷举、启发式、迭代算法探索最优映射时替代片上网络仿真器,快速得到不同输入硬件映射对应所需的延迟时间,辅助最优映射探索,计算成本较低,具有较好的泛化能力与较强的鲁棒性。

    一种基于神经网络激活分布的可重构近似乘累加单元

    公开(公告)号:CN117311663A

    公开(公告)日:2023-12-29

    申请号:CN202311305768.5

    申请日:2023-10-10

    申请人: 南京大学

    摘要: 本发明公开了一种基于神经网络激活分布的可重构近似乘累加单元,具体包括乘法模块,包括:编码器,将神经网络的激活输入和权重输入进行radix‑8 booth编码,生成对应的部分积选择信号;部分积生成器,根据部分积选择信号,生成部分积;第一加法器,将部分积按照从上到下的顺序进行累加,得到乘法结果;加法模块,包括:分类器,根据所述乘法结果的高位进行分类,分为大数和小数;压缩器,将大数进行精确压缩,将小数进行近似压缩;第二加法器,将压缩结果通过第二加法器相加,得到卷积结果。本发明在不损失太多精度的前提下有效地减少神经网络中计算单元的功耗和延时,并且能够动态的适应不同的网络类型,有着良好的实际应用价值。