-
公开(公告)号:CN114611412B
公开(公告)日:2024-07-16
申请号:CN202210436539.6
申请日:2022-04-25
Applicant: 湖南大学
IPC: G06F30/27 , G06N3/04 , G06N3/08 , G06F113/18 , G06F119/14
Abstract: 本发明涉及人工智能和集成电路设计领域,公开了一种基于神经网络的分子动力学计算芯片设计方法及系统。本发明首先生成训练深度神经网络所需的体系特征数据集;接着训练一个深度神经网络模型来精确拟合原子间受力;将训练好的模型部署到非冯诺依曼架构的芯片中,既能保证预测原子受力的精度又加速了分子动力学计算;然后搭建一个分子动力学计算系统;进行分子动力学计算并保存每一步的原子轨迹,利用原子轨迹信息计算体系的其他宏观性质,具有计算精度高、计算速度快等特点。
-
公开(公告)号:CN118351953A
公开(公告)日:2024-07-16
申请号:CN202410517259.7
申请日:2024-04-28
Applicant: 湖南大学
Abstract: 本发明涉及高性能计算技术领域,公开了一种基于流水线并行计算架构的分子动力学积分方法。本发明首先在GPU中构建仿真体系;然后修正仿真体系中的原子坐标;接着对仿真体系进行扩胞、切块、分包以及编码操作;此后GPU按照流水线模式调用势能面推理专用硬件(FPGA/ASIC)求解原子势能面;最后GPU基于专用硬件传回数据并行求解牛顿运动方程。按照上述流程不断迭代计算,直至达到所设定的仿真步数。本发明能够解决由于势能面推理专用硬件性能提升带来的协处理器性能瓶颈问题,具有硬件资源利用率高,仿真效率高等特点。
-
公开(公告)号:CN114676826A
公开(公告)日:2022-06-28
申请号:CN202210436486.8
申请日:2022-04-25
Applicant: 湖南大学
Abstract: 本发明涉及神经网络技术领域,公开了一种求解回归问题的神经网络量化方法。本发明首先获取训练数据集;然后设计一个易于硬件实现的非线性激活函数;再基于该激活函数预训练一个32位浮点型的全连接层神经网络模型;调用预训练模型,将浮点型权重值量化成2的整数次幂的形式,将浮点型偏置值、各层浮点型输入输出以及激活函数的输入输出进行定点量化;最后利用反向传播和梯度下降算法对量化网络模型进行训练。本发明采用移位求和操作代替神经网络中的乘法运算,并采用了一种电路实现简单的激活函数,在保证网络模型拟合精度的同时,大幅减少了模型推理时的运算量,便于网络模型的硬件实现,同时也加快了回归神经网络的计算速度。
-
公开(公告)号:CN118349515A
公开(公告)日:2024-07-16
申请号:CN202410517855.5
申请日:2024-04-28
Applicant: 湖南大学
IPC: G06F15/173 , G06F13/42 , G16C10/00
Abstract: 本发明涉及人工智能和集成电路设计领域,公开了一种面向分子动力学计算的PCIe通信系统。本发明为分子动力学计算的FPGA或ASIC等“非冯·诺依曼”架构计算设备,设计基于PCIe的通信系统。该系统通过PCIe Switch进行连接,实现计算设备和GPU间的P2P通信,并通过特定滑窗算法设计,显著减少分子动力学通信数据量,实现高精度、高速度的分子动力学计算。
-
公开(公告)号:CN119065846A
公开(公告)日:2024-12-03
申请号:CN202411165297.7
申请日:2024-08-23
Applicant: 湖南大学
IPC: G06F9/50 , G06F12/0831
Abstract: 本发明涉及Linux内核驱动设计领域,提出了一种面向RDMA通信的Linux内核驱动设计方法,以供GPU与第三方设备在PCIe总线下实现无需CPU参与的直接通信。本发明首先将硬件FPGA和GPU挂载在同一PCIe Switch下,在FPGA上烧录相应的逻辑和存储单元工程;然后加载上RDMA驱动将物理地址空间与虚拟地址空间进行映射以供后续内核操作;之后,上位机GPU端进行内存分配和传入相关参数进驱动,驱动填充各种寄存器参数,进行DMA传输之前的准备工作;最后,启动DMA传输后,实现两个硬件的物理地址内存空间的数据交换,由此测试出传输过程中的通信速度并评估通信的质量。本发明使用GPUDirect RDMA技术来设计内核驱动,可以实现GPU和FPGA的直接内存通信,绕过CPU内存,避免多余的通信开销,提高了通信速度。
-
公开(公告)号:CN114611412A
公开(公告)日:2022-06-10
申请号:CN202210436539.6
申请日:2022-04-25
Applicant: 湖南大学
IPC: G06F30/27 , G06N3/04 , G06N3/08 , G06F113/18 , G06F119/14
Abstract: 本发明涉及人工智能和集成电路设计领域,公开了一种基于神经网络的分子动力学计算芯片设计方法及系统。本发明首先生成训练深度神经网络所需的体系特征数据集;接着训练一个深度神经网络模型来精确拟合原子间受力;将训练好的模型部署到非冯诺依曼架构的芯片中,既能保证预测原子受力的精度又加速了分子动力学计算;然后搭建一个分子动力学计算系统;进行分子动力学计算并保存每一步的原子轨迹,利用原子轨迹信息计算体系的其他宏观性质,具有计算精度高、计算速度快等特点。
-
-
-
-
-