-
公开(公告)号:CN119474622B
公开(公告)日:2025-03-14
申请号:CN202510059378.7
申请日:2025-01-15
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本公开提供了一种面向电磁有限元方程组的并行迭代求解方法及系统,涉及电磁有限元技术领域,包括:构建待求解的电磁有限元方程组#imgabs0#;将电磁有限元方程组划分为多个计算子任务,将子任务的子矩阵块#imgabs1#和子右端项向量#imgabs2#分配给超级计算机中的各进程;利用初始化后的Householder‑GMRES算法,各进程并行进行子任务的计算,得到各进程的局部最优解#imgabs3#;对各进程的局部最优解#imgabs4#进行汇总,得到电磁有限元方程组的最优解#imgabs5#;本发明将电磁有限元、Householder‑GMRES算法、并行计算三者结合起来,利用并行优化技术提高电磁有限元线性方程组求解效率。
-
公开(公告)号:CN118193135A
公开(公告)日:2024-06-14
申请号:CN202410358987.8
申请日:2024-03-27
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F9/455
Abstract: 本公开提供了基于神威架构的PIPE‑BiCGStab求解器加速优化方法及系统,涉及求解器加速优化技术领域,包括:定位搜索PETSc库热点函数,构建众核加速模型;利用所述众核加速模型对PETSc库热点函数实现PIPE‑BiCGStab求解器加速并行计算;其中,主核初始化,读入PETSc库热点函数,对PETSc库热点函数增加线程级并行计算,利用余数法,将其作为计算任务平均分配给每个核组内的从核;对从核内存访问方式进行优化,以及对数据传输方式进行优化,并使用向量化操作对矩阵和向量计算进行加速,完成并行加速计算过程。
-
公开(公告)号:CN117436370B
公开(公告)日:2024-03-19
申请号:CN202311658183.1
申请日:2023-12-06
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F30/28 , G06F17/13 , G06F17/16 , G06F111/10 , G06F113/08 , G06F119/14
Abstract: 本公开提供了面向流体力学网格生成的超定矩阵方程并行方法及系统,涉及计算流体力学数值模拟技术领域,包括建立以网格顶点坐标值为未知数的超定稀疏矩阵方程;并行获取新的系数矩阵和右端项,各子矩阵矩阵乘、子矩阵子向量乘计算的任务划分策略是按照转置矩阵的行数分给各处理器;采用并行共轭梯度法求解,任务划分策略是以非零元个数作为划分的依据,各个处理器迭代并行计算当前近似解的最优方向、最优步长以及新的近似解,直至残差满足设置的迭代终止条件双检测要求,将最优解作为超定稀疏矩阵方程的网格顶点坐标值,构造出所期望的三维空间结构化网格。本公开提高了高精度应用需求的结构化网格生成能力。
-
公开(公告)号:CN114968600A
公开(公告)日:2022-08-30
申请号:CN202210849631.5
申请日:2022-07-19
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
Abstract: 本发明涉及一种基于新一代申威众核处理器的从核阵列任务分配实现负载均衡的方法,包括:各个从核先完成当前任务后,和主核通信,自动获取下一次任务,继续执行获取到的任务直至任务结束;主核负责任务的分配和更新;从核自动获取下一次任务包括单从核自动获取任务和多从核自动获取任务,其中,多从核自动获取任务方式按照从核分组进行,根据申威众核处理器硬件架构,从核可以进行多种从核分组方式,主要包括行从核自动获取任务方式、列从核自动获取任务方式和从核簇自动获取任务方式。本发明基于主从异步加速模式来使得从核自动获取任务,进行加速处理,进而解决负载不均衡的方法。
-
公开(公告)号:CN110262900A
公开(公告)日:2019-09-20
申请号:CN201910536896.8
申请日:2019-06-20
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种基于申威众核处理器的主核与核组之间通信锁同步运行加速方法,包括步骤如下:A、判断程序段A、程序段B、程序段C之间的程序上下文依赖关系;如果程序段A、程序段B、程序段C三者之间都存在程序上下文依赖关系,则顺序执行;否则,调整程序段A、程序段B、程序段C之间的执行顺序,进行执行;B、对连续的后三段程序段执行步骤A直至执行完所有的程序。本发明判断程序段之间的程序上下文依赖关系,分情况灵活处理,还引入了“通信锁”同步机制,节省了主核等待时间,实现了主核和核组的并行处理,程序执行过程中,减少了对spawn和join核组线程的需要次数,提高了程序的执行效率。
-
公开(公告)号:CN119474622A
公开(公告)日:2025-02-18
申请号:CN202510059378.7
申请日:2025-01-15
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本公开提供了一种面向电磁有限元方程组的并行迭代求解方法及系统,涉及电磁有限元技术领域,包括:构建待求解的电磁有限元方程组#imgabs0#;将电磁有限元方程组划分为多个计算子任务,将子任务的子矩阵块#imgabs1#和子右端项向量#imgabs2#分配给超级计算机中的各进程;利用初始化后的Householder‑GMRES算法,各进程并行进行子任务的计算,得到各进程的局部最优解#imgabs3#;对各进程的局部最优解#imgabs4#进行汇总,得到电磁有限元方程组的最优解#imgabs5#;本发明将电磁有限元、Householder‑GMRES算法、并行计算三者结合起来,利用并行优化技术提高电磁有限元线性方程组求解效率。
-
公开(公告)号:CN119006221A
公开(公告)日:2024-11-22
申请号:CN202411487280.3
申请日:2024-10-24
Applicant: 齐鲁工业大学(山东省科学院) , 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明属于分布式计算相关技术领域,为了解决现有没有充分利用计算资源来求解稀疏三角矩阵的问题,提出了电力潮流计算的稀疏三角矩阵异构并行求解方法及系统,根据稀疏三角矩阵中方程之间的依赖关系,构建有向无环图;将有向无环图中存在依赖关系的任务节点进行分层处理,得到用于并行处理的图层;根据每个图层中非零元素的数量进行分块处理,得到矩阵块;基于灵活局部性调度策略,根据父节点所在从核簇的算力情况,判断当前调度矩阵块是否调度至其父节点相邻的从核上,并结合轮询调度策略对矩阵块进行分配;进而稀疏三角求解结果。充分利用分布式系统计算资源,提高计算的准确性和实时性。
-
公开(公告)号:CN116167304B9
公开(公告)日:2024-08-06
申请号:CN202310436896.7
申请日:2023-04-23
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F30/28 , G06F17/12 , G06F17/15 , G06F17/16 , G06F111/10 , G06F113/08 , G06F119/14
Abstract: 本发明涉及油藏数值模拟技术领域,本发明公开了基于神威架构的油藏数值模拟GMRES优化方法及系统,包括:将油藏数值模拟压力方程离散后得到的压力线性方程组的求解任务,按系数矩阵的维度划分为若干个计算任务,并将计算任务并行分发至多个主核;每个主核将计算任务中热点函数的数据平均分发至从核,并调用从核进行热点函数计算;主核根据从核回传的计算结果,计算得到压力线性方程组的解。实现了两级并行和负载均衡,极大的缩短了计算时间。
-
公开(公告)号:CN117707785A
公开(公告)日:2024-03-15
申请号:CN202311870609.X
申请日:2023-12-28
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
Abstract: 本发明提出了面向浅水方程的pcg申威众核优化方法及系统,涉及数据处理技术领域。包括读取系数矩阵和右端项,设定基本条件;在管理核心中,基于整行对系数矩阵进行数据划分,在行方向上进行均匀分块,得到分块数据;对计算核心的LDM均匀划分两个分区,将分块数据分多次传输至计算核心,两个分区并行实现传输和计算过程;将同一核组内各计算核心计算后的数据进行求和,放入共享内存区域中,由指定计算核心再次求和后比较残差,判断是否满足残差下降要求。本发明使用基于行的划分方法、两级并行、避免通信等方法加快计算速度,针对浅水方程提供了高效的对角预条件PCG在神威超级计算机上的实现方式。
-
公开(公告)号:CN113703952B
公开(公告)日:2023-10-10
申请号:CN202010429029.7
申请日:2020-05-20
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F9/50
Abstract: 本发明涉及一种基于超级计算机的队列资源调度的资源分配方法,包括:(1)用户提交作业,指定计算资源数目与私人队列名;(2)提交的参数发送至系统判定,如果私人队列资源够使用,即私人队列资源中的资源数目大于计算资源数目,则用户作业正常运算,结束;否则,系统判断是否符合条件;提交的参数是指用户指定的计算资源数目与私人队列名;(3)如果符合条件,则将需要的临时节点从资源池中划分到中私人队列名对应的私人队列中,用户作业正常运算完成;否则,打印出不符合条件的理由;(4)系统将临时节点重新划回到资源池中,结束。本发明优化计算资源配置,提高效率。可以保持一个旺盛的资源队列,以供紧急时刻的资源调用。
-
-
-
-
-
-
-
-
-