-
公开(公告)号:CN104375899A
公开(公告)日:2015-02-25
申请号:CN201410677736.2
申请日:2014-11-21
Applicant: 北京应用物理与计算数学研究所
IPC: G06F9/50
Abstract: 本发明公开一种高性能计算机NUMA感知的线程和内存资源优化方法与系统,该系统包括:运行时环境探测模块,用于探测计算结点的硬件资源、并行进程数;计算资源分配管理模块,用于为并行进程分配计算资源,建立并行进程及线程与处理器核和物理内存的映射;并行编程接口及线程绑定模块,用于提供并行编程接口,根据映射关系获取线程的绑定位置掩码,将执行线程绑定到相应的CPU核。还公开一种NUMA感知的多线程内存管理器及其多线程内存管理方法,该管理器包括:DSM内存管理模块和SMP模块内存池,分别管理MPI进程所属SMP模块及单个SMP模块内部的内存分配及释放。可减少内存操作的系统调用次数,提高内存管理性能;减少应用程序的远地访存行为,提升应用程序性能。
-
公开(公告)号:CN104375882A
公开(公告)日:2015-02-25
申请号:CN201410677986.6
申请日:2014-11-21
Applicant: 北京应用物理与计算数学研究所
Abstract: 本发明提供了一种匹配于高性能计算机结构的多级嵌套数据驱动计算方法,该方法主要是为了适应于高性能计算机的体系结构,包括:匹配计算资源即计算节点-处理器-处理器核的进程-线程组-线程的三级嵌套并行计算组织,其中,在进程以及线程组两级采用静态数据分配方法且在线程组内支持任务动态调度,以及匹配网络-内存-缓存的三级嵌套数据通信与数据划分。本方法解决了现有技术在实现数据驱动并行计算时面临的计算并行性与数据局部性方面的低效问题,达到了有效负载平衡并提高通信、访存和计算效率的技术效果。
-
公开(公告)号:CN109144511A
公开(公告)日:2019-01-04
申请号:CN201810932248.X
申请日:2018-08-16
Applicant: 北京应用物理与计算数学研究所
Abstract: 本发明提供了一种数值模拟图形用户界面自动生成方法及系统,数值模拟图形用户界面自动生成方法包括:接收并读取目标数值模拟软件对应的输入模板描述文件,其中,所述输入模板描述文件根据预设的输入模板描述模型生成;以及,根据所述输入模板描述文件向预设的图形用户界面框架中自动添加对应的界面元素,得到目标数值模拟图形用户界面。本发明能够自动生成数值模拟图形用户界面,并显著提高图形用户界面的生成效率及准确性,以及能够有效提高图形用户界面可复用性及可扩展性。
-
公开(公告)号:CN108363865A
公开(公告)日:2018-08-03
申请号:CN201810135323.X
申请日:2018-02-09
Applicant: 北京应用物理与计算数学研究所
IPC: G06F17/50
Abstract: 一种粒子输运区域分解并行计算的异步输运模拟方法和系统,该方法包括:主进程采用多剖分结点的剖分算法将组合几何的区域剖分得到多个子区域;主进程为各区域进程分配模拟的子区域和粒子源;区域进程从所述粒子源中获取粒子,模拟粒子输运;区域进程将运动到子区域边界的粒子发送给对应的另一区域进程,或者,接收其他区域进程发送来的粒子,并根据与其他区域进程之间发送或接收的粒子数量更新所述子区域的粒子迁移记录;当子区域中没有待模拟的粒子时,区域进程将所述子区域的粒子迁移记录发送至主进程;主进程接收各区域进程的粒子迁移记录并核对,判断是否结束模拟。该方法能够避免全局通信,减少整个算法的进程等待时间,保证较高的并行效率。
-
公开(公告)号:CN104331336B
公开(公告)日:2016-01-20
申请号:CN201410676230.X
申请日:2014-11-21
Applicant: 北京应用物理与计算数学研究所
IPC: G06F9/50
Abstract: 本发明提供了一种匹配于高性能计算机结构的多层嵌套负载平衡方法,该方法包括:在计算机中,将计算区域划分为N个二级计算子区域,并将所述N个二级计算子区域一一对应地映射到计算机内部的N个计算节点上;在每个计算节点中,将与该计算节点对应的二级计算子区域划分为M个三级计算子区域,并将所述M个三级计算子区域一一对应地映射到该计算节点的M个CPU上。本发明解决了现有技术中仅考虑在CPU之间实现平衡而导致的系统开销大,计算速度慢,均衡效果不好的技术问题,达到了减少系统开销,提升程序的并行效率的技术效果。
-
公开(公告)号:CN104360962B
公开(公告)日:2015-10-28
申请号:CN201410674170.8
申请日:2014-11-21
Applicant: 北京应用物理与计算数学研究所
Abstract: 本发明公开了一种匹配于高性能计算机结构的多级嵌套数据传输方法与系统,其中该系统包括:并行运行于多个计算结点的多个结点通信组件,其中每一结点通信组件运行于一计算结点,每一结点通信组件包括:通信描述管理模块,用于储存和管理所在计算结点需进行的数据传输操作的描述;结点间数据传输执行模块,用于管理和执行所在计算结点与其他计算结点间的数据传输请求;并行运行于所在计算结点的多个CPU的多个数据传输调度模块,其中每一数据传输调度模块运行于一CPU上,用于在所在计算结点内创建、调度和执行通信相关事务。本发明能够匹配通用处理器多级嵌套体系结构,提升数据传输性能。
-
公开(公告)号:CN104572295A
公开(公告)日:2015-04-29
申请号:CN201410769018.8
申请日:2014-12-12
Applicant: 北京应用物理与计算数学研究所
IPC: G06F9/50
Abstract: 本发明涉及并行计算技术领域,特别是关于匹配于高性能计算机体系结构的结构网格数据管理方法包括,根据数值模拟对象确定计算区域的结构网格和所述结构网格上的物理量;将结构网格嵌套剖分为网格区、网格域、网格片,分别编号,并映射于高性能计算机的计算结点、结点内CPU、CPU计算核心;在每个网格片上,为每个物理量在该网格片上分配唯一的内存空间,用于储存该物理量定义在该网格片所有网格单元上的离散值。通过本发明实施例的上述方法可以大幅提升结构网格和物理量的存储与访问的数据局部性,支持应用软件面向高性能计算机复杂体系结构展开浮点性能优化,大幅提升计算效率。
-
公开(公告)号:CN113420466A
公开(公告)日:2021-09-21
申请号:CN202110922528.4
申请日:2021-08-12
Applicant: 北京应用物理与计算数学研究所
IPC: G06F30/20 , G06K9/62 , G06F111/10
Abstract: 本文涉及高性能数值模拟技术领域,尤其涉及一种面向跨平台自动性能优化的单元计算构件及方法。其中单元计算构件包括单元计算构件接口、循环特征适配模块、循环性能优化模板库、性能优化执行模块等部件,通过本文上述实施例的单元计算构件,可以复用单元计算循环间的共性性能优化技术,降低优化单元计算循环的优化复杂度,编写跨平台可移植的高性能单元计算循环,从而为数值模拟软件复用性能优化技术和跨平台性能可移植提供了新的技术途径。
-
公开(公告)号:CN111984916B
公开(公告)日:2021-01-12
申请号:CN202011070229.4
申请日:2020-10-09
Applicant: 北京应用物理与计算数学研究所
Abstract: 本文涉及高性能数值模拟技术领域,尤其涉及一种数理方程解算构件及并行软件研发方法与系统。其中数理方程解算构件基于并行计算构件研发,并通过数理方程解算构件接口将物理建模插件单元,工程模板插件单元,数值离散解算单元三类单元隔离,实现并行数值模拟软件研发的复杂度降低的目的。
-
公开(公告)号:CN111814384B
公开(公告)日:2020-12-11
申请号:CN202010901953.0
申请日:2020-09-01
Applicant: 北京应用物理与计算数学研究所
IPC: G06F30/23 , G06F111/10
Abstract: 本文涉及高性能数值模拟技术领域,尤其涉及高性能数值模拟的前后低开销连接数据结构及方法,其中数值计算方法包括,基于本文的几何网格数据结构,对几何模型的几何对象进行离散,生成与所述几何模型具有关联关系的网格;将高性能计算机的计算资源分解对应到网格层,其中所述网格层中包括与所述几何模型具有关联关系的网格。通过本文实施例中的几何网格数据结构可以在网格中体现数值模拟对象的几何特征,提高数值模拟精度,并将该具有数值模拟对象几何特征的网格应用于高性能计算机中,避免了现有技术中高性能数值模拟中三个阶段转换网格数据结构造成的效率低、速度慢的问题。
-
-
-
-
-
-
-
-
-