-
公开(公告)号:CN118193135A
公开(公告)日:2024-06-14
申请号:CN202410358987.8
申请日:2024-03-27
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F9/455
Abstract: 本公开提供了基于神威架构的PIPE‑BiCGStab求解器加速优化方法及系统,涉及求解器加速优化技术领域,包括:定位搜索PETSc库热点函数,构建众核加速模型;利用所述众核加速模型对PETSc库热点函数实现PIPE‑BiCGStab求解器加速并行计算;其中,主核初始化,读入PETSc库热点函数,对PETSc库热点函数增加线程级并行计算,利用余数法,将其作为计算任务平均分配给每个核组内的从核;对从核内存访问方式进行优化,以及对数据传输方式进行优化,并使用向量化操作对矩阵和向量计算进行加速,完成并行加速计算过程。
-
公开(公告)号:CN118467195A
公开(公告)日:2024-08-09
申请号:CN202410469627.5
申请日:2024-04-18
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
Abstract: 本发明提供了一种二级子结构Schwarz方法异构并行求解方法及系统,涉及数据处理技术领域,所述方法包括:获取待求解任务;根据待求解任务进行初始化及任务划分;对待求解任务进行求解;其中,待求解任务在异构众核处理器中求解,处理器的主核执行初始化及任务划分,并将划分后的浮点计算任务分配至多个从核,多个从核接收主核分配的浮点计算任务进行并行求解,并将求解结果传输至主核。本发明将浮点计算任务分配至从核进行并行计算,充分利用了主从核的多核优势,提高了计算性能和资源利用率。
-
公开(公告)号:CN116226587A
公开(公告)日:2023-06-06
申请号:CN202310209538.2
申请日:2023-03-01
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F17/12 , G06F15/177 , G06F9/50 , G06F9/46
Abstract: 本公开提供了一种辐射流体力学方程组AMG并行优化方法及系统,涉及数据计算处理技术领域,方法包括构建辐射流体力学方程组,读入方程组并初始化基本参数;利用代数多重网格法AMG对所述辐射流体力学方程组进行求解;其中,在所述代数多重网格法AMG的求解过程中,在从核中采用优化后的混合GS光滑算子进行光滑计算,包括为每个从核动态构建缓存数组;根据构建的缓存数组,将计算任务从主核分配后索引映射到每个从核;所述每个从核对需要参与计算的数据进行遍历计算,然后将迭代结果回传至主核。本公开加快了RHD方程的求解速度。
-
公开(公告)号:CN117707785A
公开(公告)日:2024-03-15
申请号:CN202311870609.X
申请日:2023-12-28
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
Abstract: 本发明提出了面向浅水方程的pcg申威众核优化方法及系统,涉及数据处理技术领域。包括读取系数矩阵和右端项,设定基本条件;在管理核心中,基于整行对系数矩阵进行数据划分,在行方向上进行均匀分块,得到分块数据;对计算核心的LDM均匀划分两个分区,将分块数据分多次传输至计算核心,两个分区并行实现传输和计算过程;将同一核组内各计算核心计算后的数据进行求和,放入共享内存区域中,由指定计算核心再次求和后比较残差,判断是否满足残差下降要求。本发明使用基于行的划分方法、两级并行、避免通信等方法加快计算速度,针对浅水方程提供了高效的对角预条件PCG在神威超级计算机上的实现方式。
-
公开(公告)号:CN118485262A
公开(公告)日:2024-08-13
申请号:CN202410666079.5
申请日:2024-05-28
Applicant: 齐鲁工业大学(山东省科学院) , 山东省计算中心(国家超级计算济南中心)
IPC: G06Q10/0631 , G06Q50/04 , G06N3/126
Abstract: 一种基于神威架构求解作业车间调度问题的遗传算法的并行优化方法,涉及作业车间调度技术领域,包括了遗传算法求解作业车间调度问题的染色体编码方案、为避免产生局部最优解的种群进化方案、遗传算法的MPI并行方案和MPI通信优化、利用神威架构提供的三种通信方式(DMA、RMA和gld/gst指令)进行微架构调优,提供了一套高效可行的并行方案。
-
公开(公告)号:CN118260991A
公开(公告)日:2024-06-28
申请号:CN202410343688.7
申请日:2024-03-25
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F30/23 , G06F30/27 , G06N3/0464
Abstract: 本发明涉及计算机处理技术领域,提供了一种面向电磁场有限元分析的GCN自适应重排序方法及系统。该方法包括,基于电磁场的相关数据,构建电磁矩阵;电磁矩阵转换成图数据结构,提取图数据结构的边特征集和顶点特征集;基于边特征集、顶点特征集和附加特征,采用双层GCN模型,在每层均聚合相邻节点的信息,得到每一层的输出特征图,预测最佳重排序算法的索引,并融合每一层的输出特征图,得到融合特征图;将融合特征图和附加特征输入第一层MLP,得到第一特征图;基于第一特征图,采用第二层MLP,得到第二特征图;基于第二特征图,采用第三层MLP,得到第三特征图;将第三特征图经过全连接层及归一化层,得到电磁矩阵的重排序结果。
-
公开(公告)号:CN117787523A
公开(公告)日:2024-03-29
申请号:CN202311850022.2
申请日:2023-12-28
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06Q10/047 , G06N3/006
Abstract: 本发明提出了求解旅行商问题的MMAS算法并行优化方法及系统,涉及并行优化技术领域。包括根据sw26010pro众核处理器的物理结构,设计一级并行MMAS算法模型,将总种群按照进程数分成若干个子种群,每一子种群对应一个进程;划分主进程和多个从属进程,将执行主进程的核组作为主核组,将执行从属进程的核组作为从属核组,多个从属核组之间为进程级并行;主核组负责管理全局信息,同时控制执行从属任务的从属核组,从属核组分别构建旅行路线,得到局部最佳路径,与主核组之间进行信息迭代,直至满足迭代停止条件,得到全局最佳路径。本发明加速了TSP问题的求解,从而满足求解较大规模旅行商问题的实际需求。
-
公开(公告)号:CN116227164A
公开(公告)日:2023-06-06
申请号:CN202310066558.9
申请日:2023-01-12
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F30/20 , G06F119/08
Abstract: 本发明公开了一种传热设备热传导的三对角异构众核并行求解方法及系统,涉及计算机处理技术领域。包括步骤:采集传热设备的热传导参数,建立传热模型;输入热传导参数至传热模型,构建热传导方程;通过差分和转化得到关于热传导的三对角线性方程组;通过并行消元的方法对三对角矩阵方程数据消除数据依赖;抽取部分组成小型三对角矩阵方程;采用追赶法求解缩减三对角矩阵方程;将各个进程以任务并行的方式回代输出三对角矩阵方程剩余全部解;并根据求解结果绘制温度变化曲线,获得热传导过程的温度变化。解决了传热设备热传导现象模拟仿真过程中,需要求解的三对角矩阵方程规模较大,导致热传导过程的分析过程耗时较长,结果不够准确的问题。
-
公开(公告)号:CN111679859B
公开(公告)日:2023-08-18
申请号:CN202010528438.2
申请日:2020-06-11
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种面向I/O密集型高性能应用的自动化并行MPI‑I/O加速方法,将用户提交作业设置的进程,利用MPI通信器分成两个通信域,一组是计算进程,另一组是服务进程,I/O服务进程的数量是用户根据I/O密集程度配置,用于处理计算进程上数据输出的任务。计算进程主要处理数值计算任务,在数值计算过程中生成的所有I/O请求都将转发到服务进程。因此,计算进程可以连续执行,不用等待I/O完成。I/O服务进程在内存中形成一个缓冲池,多次缓冲之后,通过调用底层接口将数据写入文件。本发明可以最大程度上提升I/O密集型应用的I/O性能。
-
公开(公告)号:CN116167304A
公开(公告)日:2023-05-26
申请号:CN202310436896.7
申请日:2023-04-23
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F30/28 , G06F17/12 , G06F17/15 , G06F17/16 , G06F111/10 , G06F113/08 , G06F119/14
Abstract: 本发明涉及油藏数值模拟技术领域,本发明公开了基于神威架构的油藏数值模拟GMRES优化方法及系统,包括:将油藏数值模拟压力方程离散后得到的压力线性方程组的求解任务,按系数矩阵的维度划分为若干个计算任务,并将计算任务并行分发至多个主核;每个主核将计算任务中热点函数的数据平均分发至从核,并调用从核进行热点函数计算;主核根据从核回传的计算结果,计算得到压力线性方程组的解。实现了两级并行和负载均衡,极大的缩短了计算时间。
-
-
-
-
-
-
-
-
-