高性能计算机NUMA感知的线程和内存资源优化方法与系统

    公开(公告)号:CN104375899A

    公开(公告)日:2015-02-25

    申请号:CN201410677736.2

    申请日:2014-11-21

    Abstract: 本发明公开一种高性能计算机NUMA感知的线程和内存资源优化方法与系统,该系统包括:运行时环境探测模块,用于探测计算结点的硬件资源、并行进程数;计算资源分配管理模块,用于为并行进程分配计算资源,建立并行进程及线程与处理器核和物理内存的映射;并行编程接口及线程绑定模块,用于提供并行编程接口,根据映射关系获取线程的绑定位置掩码,将执行线程绑定到相应的CPU核。还公开一种NUMA感知的多线程内存管理器及其多线程内存管理方法,该管理器包括:DSM内存管理模块和SMP模块内存池,分别管理MPI进程所属SMP模块及单个SMP模块内部的内存分配及释放。可减少内存操作的系统调用次数,提高内存管理性能;减少应用程序的远地访存行为,提升应用程序性能。

    匹配于高性能计算机结构的多级嵌套数据驱动计算方法

    公开(公告)号:CN104375882A

    公开(公告)日:2015-02-25

    申请号:CN201410677986.6

    申请日:2014-11-21

    Abstract: 本发明提供了一种匹配于高性能计算机结构的多级嵌套数据驱动计算方法,该方法主要是为了适应于高性能计算机的体系结构,包括:匹配计算资源即计算节点-处理器-处理器核的进程-线程组-线程的三级嵌套并行计算组织,其中,在进程以及线程组两级采用静态数据分配方法且在线程组内支持任务动态调度,以及匹配网络-内存-缓存的三级嵌套数据通信与数据划分。本方法解决了现有技术在实现数据驱动并行计算时面临的计算并行性与数据局部性方面的低效问题,达到了有效负载平衡并提高通信、访存和计算效率的技术效果。

    匹配于高性能计算机体系结构的结构网格数据管理方法

    公开(公告)号:CN104572295B

    公开(公告)日:2016-06-01

    申请号:CN201410769018.8

    申请日:2014-12-12

    Abstract: 本发明涉及并行计算技术领域,特别是关于匹配于高性能计算机体系结构的结构网格数据管理方法包括,根据数值模拟对象确定计算区域的结构网格和所述结构网格上的物理量;将结构网格嵌套剖分为网格区、网格域、网格片,分别编号,并映射于高性能计算机的计算结点、结点内CPU、CPU计算核心;在每个网格片上,为每个物理量在该网格片上分配特定的内存空间,用于储存该物理量定义在该网格片所有网格单元上的离散值。通过本发明实施例的上述方法可以大幅提升结构网格和物理量的存储与访问的数据局部性,支持应用软件面向高性能计算机复杂体系结构展开浮点性能优化,大幅提升计算效率。

    匹配于高性能计算机结构的多级嵌套数据驱动计算方法

    公开(公告)号:CN104375882B

    公开(公告)日:2016-06-01

    申请号:CN201410677986.6

    申请日:2014-11-21

    Abstract: 本发明提供了一种匹配于高性能计算机结构的多级嵌套数据驱动计算方法,该方法主要是为了适应于高性能计算机的体系结构,包括:匹配计算资源即计算节点-处理器-处理器核的进程-线程组-线程的三级嵌套并行计算组织,其中,在进程以及线程组两级采用静态数据分配方法且在线程组内支持任务动态调度,以及匹配网络-内存-缓存的三级嵌套数据通信与数据划分。本方法解决了现有技术在实现数据驱动并行计算时面临的计算并行性与数据局部性方面的低效问题,达到了有效负载平衡并提高通信、访存和计算效率的技术效果。

    一种并行计算构件、方法及相应并行软件开发方法与系统

    公开(公告)号:CN104375806A

    公开(公告)日:2015-02-25

    申请号:CN201410662947.9

    申请日:2014-11-19

    Abstract: 本发明涉及并行计算技术领域,特别是关于一种并行计算构件、方法及相应并行软件开发方法与系统。并行计算构件包括,并行计算构件接口,为其它单元提供数值数据并返回经过数值计算处理后的数值数据;所述数据分布存储单元,用于在进程的私有内存空间存储数据场和从并行计算构件接口接收的数值数据;所述数据并行通信单元,用于从其他进程的私有内存空间复制数据场存储到本地进程;所述数值并行计算单元,用于根据数值算法的数值模拟计算流程,独立的对本地进程的数值数据进行数值计算。通过上述实施例的方法和系统,可以显著提升软件模块的可复用性、可维护性和可扩展性,显著提升应用软件的计算效率。

    一种面向跨平台自动性能优化的单元计算构件及方法

    公开(公告)号:CN113420466A

    公开(公告)日:2021-09-21

    申请号:CN202110922528.4

    申请日:2021-08-12

    Abstract: 本文涉及高性能数值模拟技术领域,尤其涉及一种面向跨平台自动性能优化的单元计算构件及方法。其中单元计算构件包括单元计算构件接口、循环特征适配模块、循环性能优化模板库、性能优化执行模块等部件,通过本文上述实施例的单元计算构件,可以复用单元计算循环间的共性性能优化技术,降低优化单元计算循环的优化复杂度,编写跨平台可移植的高性能单元计算循环,从而为数值模拟软件复用性能优化技术和跨平台性能可移植提供了新的技术途径。

    高性能数值模拟的前后处理低开销连接数据结构及方法

    公开(公告)号:CN111814384B

    公开(公告)日:2020-12-11

    申请号:CN202010901953.0

    申请日:2020-09-01

    Abstract: 本文涉及高性能数值模拟技术领域,尤其涉及高性能数值模拟的前后低开销连接数据结构及方法,其中数值计算方法包括,基于本文的几何网格数据结构,对几何模型的几何对象进行离散,生成与所述几何模型具有关联关系的网格;将高性能计算机的计算资源分解对应到网格层,其中所述网格层中包括与所述几何模型具有关联关系的网格。通过本文实施例中的几何网格数据结构可以在网格中体现数值模拟对象的几何特征,提高数值模拟精度,并将该具有数值模拟对象几何特征的网格应用于高性能计算机中,避免了现有技术中高性能数值模拟中三个阶段转换网格数据结构造成的效率低、速度慢的问题。

    一种并行计算构件、方法及相应并行软件开发方法与系统

    公开(公告)号:CN104375806B

    公开(公告)日:2015-12-09

    申请号:CN201410662947.9

    申请日:2014-11-19

    Abstract: 本发明涉及并行计算技术领域,特别是关于一种并行计算构件、方法及相应并行软件开发方法与系统。并行计算构件包括,并行计算构件接口,为其它单元提供数值数据并返回经过数值计算处理后的数值数据;所述数据分布存储单元,用于在每个进程的私有内存空间存储的自身拥有的数据场和从并行计算构件接口接收的其他进程拥有的数值数据;所述数据并行通信单元,用于从其他进程的私有内存空间复制数据场存储到本地进程;所述数值并行计算单元,用于根据数值算法的数值模拟计算流程,独立的对本地进程的数值数据进行数值计算。通过上述实施例的方法和系统,可以显著提升软件模块的可复用性、可维护性和可扩展性,显著提升应用软件的计算效率。

    匹配于高性能计算机结构的多级嵌套数据传输方法与系统

    公开(公告)号:CN104360962A

    公开(公告)日:2015-02-18

    申请号:CN201410674170.8

    申请日:2014-11-21

    CPC classification number: G06F9/4806 G06F9/4843

    Abstract: 本发明公开了一种匹配于高性能计算机结构的多级嵌套数据传输方法与系统,其中该系统包括:并行运行于多个计算结点的多个结点通信组件,其中每一结点通信组件运行于一计算结点,每一结点通信组件包括:通信描述管理模块,用于储存和管理所在计算结点需进行的数据传输操作的描述;结点间数据传输执行模块,用于管理和执行所在计算结点与其他计算结点间的数据传输请求;并行运行于所在计算结点的多个CPU的多个数据传输调度模块,其中每一数据传输调度模块运行于一CPU上,用于在所在计算结点内创建、调度和执行通信相关事务。本发明能够匹配通用处理器多级嵌套体系结构,提升数据传输性能。

Patent Agency Ranking