-
公开(公告)号:CN104375899B
公开(公告)日:2016-03-30
申请号:CN201410677736.2
申请日:2014-11-21
Applicant: 北京应用物理与计算数学研究所
IPC: G06F9/50
Abstract: 本发明公开一种高性能计算机NUMA感知的线程和内存资源优化方法与系统,该系统包括:运行时环境探测模块,用于探测计算结点的硬件资源、并行进程数;计算资源分配管理模块,用于为并行进程分配计算资源,建立并行进程及线程与处理器核和物理内存的映射;并行编程接口及线程绑定模块,用于提供并行编程接口,根据映射关系获取线程的绑定位置掩码,将执行线程绑定到相应的CPU核。还公开一种NUMA感知的多线程内存管理器及其多线程内存管理方法,该管理器包括:DSM内存管理模块和SMP模块内存池,分别管理MPI进程所属SMP模块及单个SMP模块内部的内存分配及释放。可减少内存操作的系统调用次数,提高内存管理性能;减少应用程序的远地访存行为,提升应用程序性能。
-
公开(公告)号:CN104375899A
公开(公告)日:2015-02-25
申请号:CN201410677736.2
申请日:2014-11-21
Applicant: 北京应用物理与计算数学研究所
IPC: G06F9/50
Abstract: 本发明公开一种高性能计算机NUMA感知的线程和内存资源优化方法与系统,该系统包括:运行时环境探测模块,用于探测计算结点的硬件资源、并行进程数;计算资源分配管理模块,用于为并行进程分配计算资源,建立并行进程及线程与处理器核和物理内存的映射;并行编程接口及线程绑定模块,用于提供并行编程接口,根据映射关系获取线程的绑定位置掩码,将执行线程绑定到相应的CPU核。还公开一种NUMA感知的多线程内存管理器及其多线程内存管理方法,该管理器包括:DSM内存管理模块和SMP模块内存池,分别管理MPI进程所属SMP模块及单个SMP模块内部的内存分配及释放。可减少内存操作的系统调用次数,提高内存管理性能;减少应用程序的远地访存行为,提升应用程序性能。
-
公开(公告)号:CN104360962A
公开(公告)日:2015-02-18
申请号:CN201410674170.8
申请日:2014-11-21
Applicant: 北京应用物理与计算数学研究所
CPC classification number: G06F9/4806 , G06F9/4843
Abstract: 本发明公开了一种匹配于高性能计算机结构的多级嵌套数据传输方法与系统,其中该系统包括:并行运行于多个计算结点的多个结点通信组件,其中每一结点通信组件运行于一计算结点,每一结点通信组件包括:通信描述管理模块,用于储存和管理所在计算结点需进行的数据传输操作的描述;结点间数据传输执行模块,用于管理和执行所在计算结点与其他计算结点间的数据传输请求;并行运行于所在计算结点的多个CPU的多个数据传输调度模块,其中每一数据传输调度模块运行于一CPU上,用于在所在计算结点内创建、调度和执行通信相关事务。本发明能够匹配通用处理器多级嵌套体系结构,提升数据传输性能。
-
公开(公告)号:CN104360962B
公开(公告)日:2015-10-28
申请号:CN201410674170.8
申请日:2014-11-21
Applicant: 北京应用物理与计算数学研究所
Abstract: 本发明公开了一种匹配于高性能计算机结构的多级嵌套数据传输方法与系统,其中该系统包括:并行运行于多个计算结点的多个结点通信组件,其中每一结点通信组件运行于一计算结点,每一结点通信组件包括:通信描述管理模块,用于储存和管理所在计算结点需进行的数据传输操作的描述;结点间数据传输执行模块,用于管理和执行所在计算结点与其他计算结点间的数据传输请求;并行运行于所在计算结点的多个CPU的多个数据传输调度模块,其中每一数据传输调度模块运行于一CPU上,用于在所在计算结点内创建、调度和执行通信相关事务。本发明能够匹配通用处理器多级嵌套体系结构,提升数据传输性能。
-
-
-