-
公开(公告)号:CN111679859A
公开(公告)日:2020-09-18
申请号:CN202010528438.2
申请日:2020-06-11
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种面向I/O密集型高性能应用的自动化并行MPI-I/O加速方法,将用户提交作业设置的进程,利用MPI通信器分成两个通信域,一组是计算进程,另一组是服务进程,I/O服务进程的数量是用户根据I/O密集程度配置,用于处理计算进程上数据输出的任务。计算进程主要处理数值计算任务,在数值计算过程中生成的所有I/O请求都将转发到服务进程。因此,计算进程可以连续执行,不用等待I/O完成。I/O服务进程在内存中形成一个缓冲池,多次缓冲之后,通过调用底层接口将数据写入文件。本发明可以最大程度上提升I/O密集型应用的I/O性能。
-
公开(公告)号:CN109145255A
公开(公告)日:2019-01-04
申请号:CN201810593876.X
申请日:2018-06-11
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F17/16
CPC classification number: G06F17/16
Abstract: 本发明涉及一种稀疏矩阵LU分解行更新的异构并行计算方法。本发明在superlu算法的基础上,结合太湖之光的主从异构特点,使superlu求解器在矩阵分解阶段,对行更新的过程中,将大规模计算任务转移至从核,利用从核组高效的计算和数据通信能力,提高超大规模稀疏矩阵的求解计算能力,进一步求解的整体性能。本发明按矩阵的数据进行任务划分的方式,对矩阵数据块按行进行划分,首先为每个从核开辟一个矩阵空间,每个从核负责几个矩阵行的求解,在求下三角单位矩阵类型的线性方程组的过程中,各行数据相互独立,避免求解空间发生冲突和依赖,顺利实现对方程组的求解。
-
公开(公告)号:CN118673710A
公开(公告)日:2024-09-20
申请号:CN202410819213.0
申请日:2024-06-24
Applicant: 齐鲁工业大学(山东省科学院) , 山东省计算中心(国家超级计算济南中心)
IPC: G06F30/20 , G06F15/173 , G06F13/28 , G06F111/10 , G06F119/08
Abstract: 本公开提供了二维热传导数值模拟CG算法异构并行优化方法及系统,涉及热传导数值模拟技术领域,获取二维空间内热量传递的热传导方程,进行离散化,并转换为线性方程组;利用共轭梯度算法对线性方程组进行并行优化迭代求解,以获得热传导过程的数值解;求解过程中,识别共轭梯度算法热点函数,在稀疏矩阵向量乘法中采用通信掩盖的访存方法,在共轭梯度算法迭代环节,通过RMA技术优化计算步长因子与更新共轭方向所必需的两个向量内积操作,将向量数据分发到不同的从核,进行计算后再将结果合并,并使得一个从核通过RMAll式发起对其它从核LDM的访问,利用具有依赖关系的函数进行整合主从核间数据,实现从核计算的加速。
-
公开(公告)号:CN117436370A
公开(公告)日:2024-01-23
申请号:CN202311658183.1
申请日:2023-12-06
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F30/28 , G06F17/13 , G06F17/16 , G06F111/10 , G06F113/08 , G06F119/14
Abstract: 本公开提供了面向流体力学网格生成的超定矩阵方程并行方法及系统,涉及计算流体力学数值模拟技术领域,包括建立以网格顶点坐标值为未知数的超定稀疏矩阵方程;并行获取新的系数矩阵和右端项,各子矩阵矩阵乘、子矩阵子向量乘计算的任务划分策略是按照转置矩阵的行数分给各处理器;采用并行共轭梯度法求解,任务划分策略是以非零元个数作为划分的依据,各个处理器迭代并行计算当前近似解的最优方向、最优步长以及新的近似解,直至残差满足设置的迭代终止条件双检测要求,将最优解作为超定稀疏矩阵方程的网格顶点坐标值,构造出所期望的三维空间结构化网格。本公开提高了高精度应用需求的结构化网格生成能力。
-
公开(公告)号:CN116167304B
公开(公告)日:2023-07-25
申请号:CN202310436896.7
申请日:2023-04-23
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F30/28 , G06F17/12 , G06F17/15 , G06F17/16 , G06F111/10 , G06F113/08 , G06F119/14
Abstract: 本发明涉及油藏数值模拟技术领域,本发明公开了基于神威架构的油藏数值模拟GMRES优化方法及系统,包括:将油藏数值模拟压力方程离散后得到的压力线性方程组的求解任务,按系数矩阵的维度划分为若干个计算任务,并将计算任务并行分发至多个主核;每个主核将计算任务中热点函数的数据平均分发至从核,并调用从核进行热点函数计算;主核根据从核回传的计算结果,计算得到压力线性方程组的解。实现了两级并行和负载均衡,极大的缩短了计算时间。
-
公开(公告)号:CN116226587A
公开(公告)日:2023-06-06
申请号:CN202310209538.2
申请日:2023-03-01
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F17/12 , G06F15/177 , G06F9/50 , G06F9/46
Abstract: 本公开提供了一种辐射流体力学方程组AMG并行优化方法及系统,涉及数据计算处理技术领域,方法包括构建辐射流体力学方程组,读入方程组并初始化基本参数;利用代数多重网格法AMG对所述辐射流体力学方程组进行求解;其中,在所述代数多重网格法AMG的求解过程中,在从核中采用优化后的混合GS光滑算子进行光滑计算,包括为每个从核动态构建缓存数组;根据构建的缓存数组,将计算任务从主核分配后索引映射到每个从核;所述每个从核对需要参与计算的数据进行遍历计算,然后将迭代结果回传至主核。本公开加快了RHD方程的求解速度。
-
公开(公告)号:CN115952385B
公开(公告)日:2023-05-05
申请号:CN202310224172.6
申请日:2023-03-10
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明公开了一种用于大规模稀疏方程组求解的并行超节点排序方法及系统,涉及高性能计算技术领域,针对在稀疏矩阵LU分解过程中生成的超级节点块状矩阵,基于二维进程网格,按照块状矩阵的行和列循环映射矩阵数据,将该块状矩阵的上三角部分数据通过转置映射到处理下三角部分数据的进程中,同时采用动态分配资源的策略,根据实际映射到进程的行矩阵块的数量,为每个进程网格中的进程分配内存,以此节省大量的内存空间,提高内存扩展性,并提高稀疏矩阵求解的规模扩展性,解决现有排序方法无法适用于求解大规模稀疏线性方程组的问题。
-
公开(公告)号:CN115827247A
公开(公告)日:2023-03-21
申请号:CN202211655633.7
申请日:2022-12-22
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
IPC: G06F9/50 , G06F9/48 , G06F30/28 , G06F113/08 , G06F119/14
Abstract: 本公开提供了一种LBM算法迁移模块的数据计算并行优化方法及系统,涉及流体力学技术领域,包括确定计算区域、初始化条件以及边界条件,设置物理参数和分布函数;获取计算模型,并对模型中三维数据交换进行降维,根据数据交换的方向对整体进行分离;根据数据交换的方向进行数据的定位,将数据的交换类型映射到网格中,根据格点的坐标对网格进行区域划分,得到不同方向上数据交换类型的区域,对格点所有方向进行计算,将数据进行存储,计算完成后,进行数据的传回。通过本公开的方法每个格点可以单独完成流迁移模块的计算,达到了并行的目的。
-
公开(公告)号:CN115619890A
公开(公告)日:2023-01-17
申请号:CN202211545390.1
申请日:2022-12-05
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明提出了基于并行随机迭代求解线性方程组的断层成像方法及系统,涉及计算机断层成像技术领域,建立以像素点吸收系数为未知数的线性方程组;将线性方程组的求解任务按行划分到各处理器上;迭代并行计算各处理器对当前近似解的最优投影和新的近似解,直到新的近似解满足设置的求解精度要求,新的近似解为线性方程组的最终解,即为断层每个像素点的吸收系数;将吸收系数的大小作为灰度图像的像素点亮度大小,绘制断层图像;本发明使用多个处理器并行计算,有效地解决现有方法存储和计算的瓶颈,高效求解计算机断层成像中高精度扫描所产生的高维方程组,减少求解所消耗的内存空间和求解时间,使得计算机断层成像可以产生更高精度的图像。
-
公开(公告)号:CN114970294B
公开(公告)日:2022-10-25
申请号:CN202210922499.6
申请日:2022-08-02
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明属于数据处理技术领域,提供了基于神威架构的三维应变仿真PCG并行优化方法及系统,该方案通过对弹性体三维应变仿真PCG迭代算法数据划分优化、从核访存优化、双缓冲优化策略、任务并行与数据并行结合优化、从核间RMA通信优化,该方法为针对神威新一代超算平台开发、移植或优化应变弹性固体的平衡仿真程序的开发人员提供了一种通用的优化方法。
-
-
-
-
-
-
-
-
-