高性能计算机NUMA感知的线程和内存资源优化方法与系统

    公开(公告)号:CN104375899A

    公开(公告)日:2015-02-25

    申请号:CN201410677736.2

    申请日:2014-11-21

    Abstract: 本发明公开一种高性能计算机NUMA感知的线程和内存资源优化方法与系统,该系统包括:运行时环境探测模块,用于探测计算结点的硬件资源、并行进程数;计算资源分配管理模块,用于为并行进程分配计算资源,建立并行进程及线程与处理器核和物理内存的映射;并行编程接口及线程绑定模块,用于提供并行编程接口,根据映射关系获取线程的绑定位置掩码,将执行线程绑定到相应的CPU核。还公开一种NUMA感知的多线程内存管理器及其多线程内存管理方法,该管理器包括:DSM内存管理模块和SMP模块内存池,分别管理MPI进程所属SMP模块及单个SMP模块内部的内存分配及释放。可减少内存操作的系统调用次数,提高内存管理性能;减少应用程序的远地访存行为,提升应用程序性能。

    匹配于高性能计算机结构的多级嵌套数据驱动计算方法

    公开(公告)号:CN104375882A

    公开(公告)日:2015-02-25

    申请号:CN201410677986.6

    申请日:2014-11-21

    Abstract: 本发明提供了一种匹配于高性能计算机结构的多级嵌套数据驱动计算方法,该方法主要是为了适应于高性能计算机的体系结构,包括:匹配计算资源即计算节点-处理器-处理器核的进程-线程组-线程的三级嵌套并行计算组织,其中,在进程以及线程组两级采用静态数据分配方法且在线程组内支持任务动态调度,以及匹配网络-内存-缓存的三级嵌套数据通信与数据划分。本方法解决了现有技术在实现数据驱动并行计算时面临的计算并行性与数据局部性方面的低效问题,达到了有效负载平衡并提高通信、访存和计算效率的技术效果。

    针对反应堆机械反应性补偿的蒙特卡罗模拟方法

    公开(公告)号:CN115099139B

    公开(公告)日:2024-04-09

    申请号:CN202210702142.7

    申请日:2022-06-21

    Abstract: 针对反应堆机械反应性补偿的蒙特卡罗模拟方法,步骤如下:1、为同一组控制棒组内的几何体赋予相同的特征字符串;2、按几何尺寸与邻接关系建立控制棒组层次结构;3、制定控制棒组步进策略,将策略映射为CSG几何体移动;4、将控制棒CSG几何体移动等效为中子虚拟位移,在蒙特卡罗粒子输运过程中完成截面替换,实现对控制棒移动的模拟;5、用蒙特卡罗方法求解中子输运方程,计算中子盈余;6、裂变源迭代求解过程中,对控制棒价值进行拟合,按临界条件对控制棒位进行搜索;7、统计临界控制棒位。本发明通过改进蒙特卡罗裂变源迭代过程中的截面计算,并结合内嵌控制棒价值拟合技术实现控制棒运动的模拟以及临界控制棒位的计算。

    波前畸变信息预测方法、装置、电子设备及存储介质

    公开(公告)号:CN117689993A

    公开(公告)日:2024-03-12

    申请号:CN202311657488.0

    申请日:2023-12-05

    Abstract: 本申请提供一种波前畸变信息预测方法,该方法包括:获取通过目标远场光斑测量系统测量到的原始远场光斑;通过目标远场光斑测量系统的第一系统参数以及标准远场光斑模拟系统的第二系统参数对原始远场光斑进行定标处理,得到标准远场光斑;将标准远场光斑输入到训练好的神经网络模型中进行预测处理,得到预测波前畸变信息,训练好的神经网络模型根据定标处理后的样本标准远场光斑以及对应波前畸变真值进行训练得到。本申请通过将不同远场光斑测量系统测量得到的不同参数的原始远场光斑定标为标准远场光斑,将标准远场光斑作为训练好的神经网络模型的输入,能适用于各种不同测量系统的波前畸变信息预测,提高不同场景下的波前畸变信息预测效率。

    一种固溶合金物态方程的快速计算方法

    公开(公告)号:CN116431957B

    公开(公告)日:2023-11-07

    申请号:CN202310304954.0

    申请日:2023-03-27

    Abstract: 本发明提供了一种固溶合金物态方程的快速计算方法,涉及固溶合金技术领域,所述固溶合金物态方程的快速计算方法,包括:基于平均场势法计算离子经典振动对自由能的贡献#imgabs0#基于所述离子热振动中量子效应的影响,计算量子修正项#imgabs1#计算所述离子经典振动对自由能的贡献#imgabs2#与所述量子修正项#imgabs3#之和,得到所述离子热振动对自由能的贡献Fvib(V,T)。本发明能够避免计算固溶合金的3n阶动力学矩阵,可以使计算开销降低约两个量级,修正了热膨胀系数及比热等热物性的低温非物理行为,避免了固溶合金声子所需的较大计算开销。

    基于深度学习的流体力学求解方法及装置

    公开(公告)号:CN114841045A

    公开(公告)日:2022-08-02

    申请号:CN202210298787.9

    申请日:2022-03-23

    Abstract: 本发明公开了一种基于深度学习的流体力学求解方法及装置,该方法包括:获取待求解流体力学问题的已知量,以及将已知量进行去物理化得到模型输入量;将模型输入量输入预先训练的通用深度学习模型,以得到输出量;通用深度学习模型由待求解流体力学问题对应的去物理化训练样本训练得到,去物理化训练样本包括去物理化的输入量及与输入量对应的输出量,输出量由输入量输入预设的计算流体力学算法计算得到,输入量在预设有限空间内随机采样得到;将输出量进行物理化得到求解结果。本发明实施例可以快速应用于大型程序求解中,降低由于新算法更迭带来的学习、移植和优化成本,提高基于GPU的并行效率。

    基于红黑树的有限元单元快速查找方法及系统

    公开(公告)号:CN111967175A

    公开(公告)日:2020-11-20

    申请号:CN202010751536.2

    申请日:2020-07-30

    Inventor: 刘勤勇 刘晓萌

    Abstract: 本发明公开了一种基于红黑树的有限元单元快速查找方法及系统,涉及光学有限元分析领域。该方法包括:根据有限元分析算法对目标物进行网格剖分,对穿过目标物的光线进行追迹,根据追迹结果确定光线穿过的表面单元的ID;以表面单元的ID为键,从预设的红黑树中查找与键对应的值,根据与键对应的值确定光线穿过的体单元,其中,红黑树包含至少一个键值对,键值对的键为目标物包含的表面单元的ID,键值对的值为目标物包含的体单元的ID。本发明解决了现有体单元检索方案内存消耗高,耗时长的问题能够减小内存消耗,减少复杂度,提高了计算效率,从而使得光线网格方法成为可能。

Patent Agency Ranking