一种基于流水线并行计算架构的分子动力学积分方法

    公开(公告)号:CN118351953A

    公开(公告)日:2024-07-16

    申请号:CN202410517259.7

    申请日:2024-04-28

    Applicant: 湖南大学

    Abstract: 本发明涉及高性能计算技术领域,公开了一种基于流水线并行计算架构的分子动力学积分方法。本发明首先在GPU中构建仿真体系;然后修正仿真体系中的原子坐标;接着对仿真体系进行扩胞、切块、分包以及编码操作;此后GPU按照流水线模式调用势能面推理专用硬件(FPGA/ASIC)求解原子势能面;最后GPU基于专用硬件传回数据并行求解牛顿运动方程。按照上述流程不断迭代计算,直至达到所设定的仿真步数。本发明能够解决由于势能面推理专用硬件性能提升带来的协处理器性能瓶颈问题,具有硬件资源利用率高,仿真效率高等特点。

    一种求解回归问题的神经网络量化方法

    公开(公告)号:CN114676826A

    公开(公告)日:2022-06-28

    申请号:CN202210436486.8

    申请日:2022-04-25

    Applicant: 湖南大学

    Abstract: 本发明涉及神经网络技术领域,公开了一种求解回归问题的神经网络量化方法。本发明首先获取训练数据集;然后设计一个易于硬件实现的非线性激活函数;再基于该激活函数预训练一个32位浮点型的全连接层神经网络模型;调用预训练模型,将浮点型权重值量化成2的整数次幂的形式,将浮点型偏置值、各层浮点型输入输出以及激活函数的输入输出进行定点量化;最后利用反向传播和梯度下降算法对量化网络模型进行训练。本发明采用移位求和操作代替神经网络中的乘法运算,并采用了一种电路实现简单的激活函数,在保证网络模型拟合精度的同时,大幅减少了模型推理时的运算量,便于网络模型的硬件实现,同时也加快了回归神经网络的计算速度。

    一种面向RDMA通信的Linux内核驱动设计方法

    公开(公告)号:CN119065846A

    公开(公告)日:2024-12-03

    申请号:CN202411165297.7

    申请日:2024-08-23

    Applicant: 湖南大学

    Abstract: 本发明涉及Linux内核驱动设计领域,提出了一种面向RDMA通信的Linux内核驱动设计方法,以供GPU与第三方设备在PCIe总线下实现无需CPU参与的直接通信。本发明首先将硬件FPGA和GPU挂载在同一PCIe Switch下,在FPGA上烧录相应的逻辑和存储单元工程;然后加载上RDMA驱动将物理地址空间与虚拟地址空间进行映射以供后续内核操作;之后,上位机GPU端进行内存分配和传入相关参数进驱动,驱动填充各种寄存器参数,进行DMA传输之前的准备工作;最后,启动DMA传输后,实现两个硬件的物理地址内存空间的数据交换,由此测试出传输过程中的通信速度并评估通信的质量。本发明使用GPUDirect RDMA技术来设计内核驱动,可以实现GPU和FPGA的直接内存通信,绕过CPU内存,避免多余的通信开销,提高了通信速度。

Patent Agency Ranking