-
公开(公告)号:CN118193135A
公开(公告)日:2024-06-14
申请号:CN202410358987.8
申请日:2024-03-27
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F9/455
Abstract: 本公开提供了基于神威架构的PIPE‑BiCGStab求解器加速优化方法及系统,涉及求解器加速优化技术领域,包括:定位搜索PETSc库热点函数,构建众核加速模型;利用所述众核加速模型对PETSc库热点函数实现PIPE‑BiCGStab求解器加速并行计算;其中,主核初始化,读入PETSc库热点函数,对PETSc库热点函数增加线程级并行计算,利用余数法,将其作为计算任务平均分配给每个核组内的从核;对从核内存访问方式进行优化,以及对数据传输方式进行优化,并使用向量化操作对矩阵和向量计算进行加速,完成并行加速计算过程。
-
公开(公告)号:CN114968600A
公开(公告)日:2022-08-30
申请号:CN202210849631.5
申请日:2022-07-19
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
Abstract: 本发明涉及一种基于新一代申威众核处理器的从核阵列任务分配实现负载均衡的方法,包括:各个从核先完成当前任务后,和主核通信,自动获取下一次任务,继续执行获取到的任务直至任务结束;主核负责任务的分配和更新;从核自动获取下一次任务包括单从核自动获取任务和多从核自动获取任务,其中,多从核自动获取任务方式按照从核分组进行,根据申威众核处理器硬件架构,从核可以进行多种从核分组方式,主要包括行从核自动获取任务方式、列从核自动获取任务方式和从核簇自动获取任务方式。本发明基于主从异步加速模式来使得从核自动获取任务,进行加速处理,进而解决负载不均衡的方法。
-
公开(公告)号:CN120012426A
公开(公告)日:2025-05-16
申请号:CN202510119252.4
申请日:2025-01-24
Applicant: 齐鲁工业大学(山东省科学院) , 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明提出了一种基于神威架构的迭代求解器优化方法与系统,涉及电子信息技术领域,针对的问题是:目前神威新一代超级计算机中适用于SW26010Pro架构的AztecOO仍然采用双精度算法,存储和计算成本大,AztecOO求解器计算效率低、计算精度低。该方法获取稀疏线性方程组的求解任务,并将所述求解任务下发至主核;主核划分求解任务,并为其分配内存;主核调用从核启动函数,并执行计算;从核将计算结果反馈给主核,得到稀疏线性方程组的解。本发明通过设计的精度选择策略、矩阵分割算和混合精度算法,优化迭代求解器,在保证足够计算精度的情况下,提高算法计算速度,节约内存资源,以加速求解器整个求解过程,为数值计算方面的研究人员提供更高效的开发效率。
-
公开(公告)号:CN118467195A
公开(公告)日:2024-08-09
申请号:CN202410469627.5
申请日:2024-04-18
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
Abstract: 本发明提供了一种二级子结构Schwarz方法异构并行求解方法及系统,涉及数据处理技术领域,所述方法包括:获取待求解任务;根据待求解任务进行初始化及任务划分;对待求解任务进行求解;其中,待求解任务在异构众核处理器中求解,处理器的主核执行初始化及任务划分,并将划分后的浮点计算任务分配至多个从核,多个从核接收主核分配的浮点计算任务进行并行求解,并将求解结果传输至主核。本发明将浮点计算任务分配至从核进行并行计算,充分利用了主从核的多核优势,提高了计算性能和资源利用率。
-
公开(公告)号:CN118673710A
公开(公告)日:2024-09-20
申请号:CN202410819213.0
申请日:2024-06-24
Applicant: 齐鲁工业大学(山东省科学院) , 山东省计算中心(国家超级计算济南中心)
IPC: G06F30/20 , G06F15/173 , G06F13/28 , G06F111/10 , G06F119/08
Abstract: 本公开提供了二维热传导数值模拟CG算法异构并行优化方法及系统,涉及热传导数值模拟技术领域,获取二维空间内热量传递的热传导方程,进行离散化,并转换为线性方程组;利用共轭梯度算法对线性方程组进行并行优化迭代求解,以获得热传导过程的数值解;求解过程中,识别共轭梯度算法热点函数,在稀疏矩阵向量乘法中采用通信掩盖的访存方法,在共轭梯度算法迭代环节,通过RMA技术优化计算步长因子与更新共轭方向所必需的两个向量内积操作,将向量数据分发到不同的从核,进行计算后再将结果合并,并使得一个从核通过RMAll式发起对其它从核LDM的访问,利用具有依赖关系的函数进行整合主从核间数据,实现从核计算的加速。
-
公开(公告)号:CN116226587A
公开(公告)日:2023-06-06
申请号:CN202310209538.2
申请日:2023-03-01
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F17/12 , G06F15/177 , G06F9/50 , G06F9/46
Abstract: 本公开提供了一种辐射流体力学方程组AMG并行优化方法及系统,涉及数据计算处理技术领域,方法包括构建辐射流体力学方程组,读入方程组并初始化基本参数;利用代数多重网格法AMG对所述辐射流体力学方程组进行求解;其中,在所述代数多重网格法AMG的求解过程中,在从核中采用优化后的混合GS光滑算子进行光滑计算,包括为每个从核动态构建缓存数组;根据构建的缓存数组,将计算任务从主核分配后索引映射到每个从核;所述每个从核对需要参与计算的数据进行遍历计算,然后将迭代结果回传至主核。本公开加快了RHD方程的求解速度。
-
公开(公告)号:CN115827247A
公开(公告)日:2023-03-21
申请号:CN202211655633.7
申请日:2022-12-22
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
IPC: G06F9/50 , G06F9/48 , G06F30/28 , G06F113/08 , G06F119/14
Abstract: 本公开提供了一种LBM算法迁移模块的数据计算并行优化方法及系统,涉及流体力学技术领域,包括确定计算区域、初始化条件以及边界条件,设置物理参数和分布函数;获取计算模型,并对模型中三维数据交换进行降维,根据数据交换的方向对整体进行分离;根据数据交换的方向进行数据的定位,将数据的交换类型映射到网格中,根据格点的坐标对网格进行区域划分,得到不同方向上数据交换类型的区域,对格点所有方向进行计算,将数据进行存储,计算完成后,进行数据的传回。通过本公开的方法每个格点可以单独完成流迁移模块的计算,达到了并行的目的。
-
公开(公告)号:CN119006221A
公开(公告)日:2024-11-22
申请号:CN202411487280.3
申请日:2024-10-24
Applicant: 齐鲁工业大学(山东省科学院) , 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明属于分布式计算相关技术领域,为了解决现有没有充分利用计算资源来求解稀疏三角矩阵的问题,提出了电力潮流计算的稀疏三角矩阵异构并行求解方法及系统,根据稀疏三角矩阵中方程之间的依赖关系,构建有向无环图;将有向无环图中存在依赖关系的任务节点进行分层处理,得到用于并行处理的图层;根据每个图层中非零元素的数量进行分块处理,得到矩阵块;基于灵活局部性调度策略,根据父节点所在从核簇的算力情况,判断当前调度矩阵块是否调度至其父节点相邻的从核上,并结合轮询调度策略对矩阵块进行分配;进而稀疏三角求解结果。充分利用分布式系统计算资源,提高计算的准确性和实时性。
-
公开(公告)号:CN117707785A
公开(公告)日:2024-03-15
申请号:CN202311870609.X
申请日:2023-12-28
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
Abstract: 本发明提出了面向浅水方程的pcg申威众核优化方法及系统,涉及数据处理技术领域。包括读取系数矩阵和右端项,设定基本条件;在管理核心中,基于整行对系数矩阵进行数据划分,在行方向上进行均匀分块,得到分块数据;对计算核心的LDM均匀划分两个分区,将分块数据分多次传输至计算核心,两个分区并行实现传输和计算过程;将同一核组内各计算核心计算后的数据进行求和,放入共享内存区域中,由指定计算核心再次求和后比较残差,判断是否满足残差下降要求。本发明使用基于行的划分方法、两级并行、避免通信等方法加快计算速度,针对浅水方程提供了高效的对角预条件PCG在神威超级计算机上的实现方式。
-
公开(公告)号:CN114968374A
公开(公告)日:2022-08-30
申请号:CN202210849632.X
申请日:2022-07-19
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
Abstract: 本发明涉及一种基于新一代神威超级计算机的多层循环进程级和线程级协同自动优化方法,包括:将应用程序中的多层循环程序段和硬件架构相互对应,实现各层循环到硬件架构上的代码级映射;根据硬件架构层次不同,分别进行进程级和线程级的并行优化,其中,进程级优化即节点内通信优化和节点间的通信优化,使得各个进程在各自通信域中进行集中通信,减少程序优化过程中各个进程之间的通信;线程级优化即核组内主从传输优化。本发明提高了运行效率。
-
-
-
-
-
-
-
-
-