-
公开(公告)号:CN116167304B9
公开(公告)日:2024-08-06
申请号:CN202310436896.7
申请日:2023-04-23
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F30/28 , G06F17/12 , G06F17/15 , G06F17/16 , G06F111/10 , G06F113/08 , G06F119/14
Abstract: 本发明涉及油藏数值模拟技术领域,本发明公开了基于神威架构的油藏数值模拟GMRES优化方法及系统,包括:将油藏数值模拟压力方程离散后得到的压力线性方程组的求解任务,按系数矩阵的维度划分为若干个计算任务,并将计算任务并行分发至多个主核;每个主核将计算任务中热点函数的数据平均分发至从核,并调用从核进行热点函数计算;主核根据从核回传的计算结果,计算得到压力线性方程组的解。实现了两级并行和负载均衡,极大的缩短了计算时间。
-
公开(公告)号:CN113703952B
公开(公告)日:2023-10-10
申请号:CN202010429029.7
申请日:2020-05-20
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F9/50
Abstract: 本发明涉及一种基于超级计算机的队列资源调度的资源分配方法,包括:(1)用户提交作业,指定计算资源数目与私人队列名;(2)提交的参数发送至系统判定,如果私人队列资源够使用,即私人队列资源中的资源数目大于计算资源数目,则用户作业正常运算,结束;否则,系统判断是否符合条件;提交的参数是指用户指定的计算资源数目与私人队列名;(3)如果符合条件,则将需要的临时节点从资源池中划分到中私人队列名对应的私人队列中,用户作业正常运算完成;否则,打印出不符合条件的理由;(4)系统将临时节点重新划回到资源池中,结束。本发明优化计算资源配置,提高效率。可以保持一个旺盛的资源队列,以供紧急时刻的资源调用。
-
公开(公告)号:CN115587279A
公开(公告)日:2023-01-10
申请号:CN202110755290.0
申请日:2021-07-05
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种基于超大规模稀疏矩阵分布式读取减少单节点内存的方法及系统,超大规模稀疏矩阵通过Rutherford‑Boeing格式存储,包括:(1)为了矩阵运算方便和利于并行,将Rutherford‑Boeing格式转为行压缩,以行压缩格式存储数据;(2)节点计算各自分块矩阵行压缩的行指针、列索引以及非零元值;(3)节点将计算得到的各自行指针、列索引以及非零元值以行压缩格式写入各自文件;(4)当应用需要超大规模稀疏矩阵时,节点从各自文件中读取数据,结束。本发明多节点并行读入时,读取速度快,节点之间不用再分发数据,避免了通信拥挤,提升了整体性能。
-
公开(公告)号:CN110262900B
公开(公告)日:2023-09-29
申请号:CN201910536896.8
申请日:2019-06-20
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种基于申威众核处理器的主核与核组之间通信锁同步运行加速方法,包括步骤如下:A、判断程序段A、程序段B、程序段C之间的程序上下文依赖关系;如果程序段A、程序段B、程序段C三者之间都存在程序上下文依赖关系,则顺序执行;否则,调整程序段A、程序段B、程序段C之间的执行顺序,进行执行;B、对连续的后三段程序段执行步骤A直至执行完所有的程序。本发明判断程序段之间的程序上下文依赖关系,分情况灵活处理,还引入了“通信锁”同步机制,节省了主核等待时间,实现了主核和核组的并行处理,程序执行过程中,减少了对spawn和join核组线程的需要次数,提高了程序的执行效率。
-
公开(公告)号:CN111679859B
公开(公告)日:2023-08-18
申请号:CN202010528438.2
申请日:2020-06-11
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种面向I/O密集型高性能应用的自动化并行MPI‑I/O加速方法,将用户提交作业设置的进程,利用MPI通信器分成两个通信域,一组是计算进程,另一组是服务进程,I/O服务进程的数量是用户根据I/O密集程度配置,用于处理计算进程上数据输出的任务。计算进程主要处理数值计算任务,在数值计算过程中生成的所有I/O请求都将转发到服务进程。因此,计算进程可以连续执行,不用等待I/O完成。I/O服务进程在内存中形成一个缓冲池,多次缓冲之后,通过调用底层接口将数据写入文件。本发明可以最大程度上提升I/O密集型应用的I/O性能。
-
公开(公告)号:CN116167304A
公开(公告)日:2023-05-26
申请号:CN202310436896.7
申请日:2023-04-23
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F30/28 , G06F17/12 , G06F17/15 , G06F17/16 , G06F111/10 , G06F113/08 , G06F119/14
Abstract: 本发明涉及油藏数值模拟技术领域,本发明公开了基于神威架构的油藏数值模拟GMRES优化方法及系统,包括:将油藏数值模拟压力方程离散后得到的压力线性方程组的求解任务,按系数矩阵的维度划分为若干个计算任务,并将计算任务并行分发至多个主核;每个主核将计算任务中热点函数的数据平均分发至从核,并调用从核进行热点函数计算;主核根据从核回传的计算结果,计算得到压力线性方程组的解。实现了两级并行和负载均衡,极大的缩短了计算时间。
-
公开(公告)号:CN115619890B
公开(公告)日:2023-04-07
申请号:CN202211545390.1
申请日:2022-12-05
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明提出了基于并行随机迭代求解线性方程组的断层成像方法及系统,涉及计算机断层成像技术领域,建立以像素点吸收系数为未知数的线性方程组;将线性方程组的求解任务按行划分到各处理器上;迭代并行计算各处理器对当前近似解的最优投影和新的近似解,直到新的近似解满足设置的求解精度要求,新的近似解为线性方程组的最终解,即为断层每个像素点的吸收系数;将吸收系数的大小作为灰度图像的像素点亮度大小,绘制断层图像;本发明使用多个处理器并行计算,有效地解决现有方法存储和计算的瓶颈,高效求解计算机断层成像中高精度扫描所产生的高维方程组,减少求解所消耗的内存空间和求解时间,使得计算机断层成像可以产生更高精度的图像。
-
公开(公告)号:CN112181894B
公开(公告)日:2022-05-31
申请号:CN201910599786.6
申请日:2019-07-04
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种基于申威众核处理器的核组内分组自适应调整运行方法,包括:(1)对核组的资源进行分组:当从核阵列只接收了一个程序段,则不进行从核阵列的数量分组,否则,如果从核阵列接收了n个无程序上下文依赖关系的程序段,n>1,则将从核阵列中的64个从核平均分成n组,分别分配给这n个程序段;(2)监控从核阵列运行状态、从核阵列的分组I/O情况,并将获得的监控信息发送至从核阵列可分组算法;(3)对传送的监控信息进行实时评估,根据评估结果对各并行应用程序段使用的从核数量进行实时调整;(4)周期性的执行上述步骤(1)至步骤(3),使被调整的并行程序段达到核组内从核计算资源利用率和I/O带宽利用率的均衡。
-
公开(公告)号:CN109145255B
公开(公告)日:2022-03-29
申请号:CN201810593876.X
申请日:2018-06-11
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F17/16
Abstract: 本发明涉及一种稀疏矩阵LU分解行更新的异构并行计算方法。本发明在superlu算法的基础上,结合太湖之光的主从异构特点,使superlu求解器在矩阵分解阶段,对行更新的过程中,将大规模计算任务转移至从核,利用从核组高效的计算和数据通信能力,提高超大规模稀疏矩阵的求解计算能力,进一步求解的整体性能。本发明按矩阵的数据进行任务划分的方式,对矩阵数据块按行进行划分,首先为每个从核开辟一个矩阵空间,每个从核负责几个矩阵行的求解,在求下三角单位矩阵类型的线性方程组的过程中,各行数据相互独立,避免求解空间发生冲突和依赖,顺利实现对方程组的求解。
-
公开(公告)号:CN111679859A
公开(公告)日:2020-09-18
申请号:CN202010528438.2
申请日:2020-06-11
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种面向I/O密集型高性能应用的自动化并行MPI-I/O加速方法,将用户提交作业设置的进程,利用MPI通信器分成两个通信域,一组是计算进程,另一组是服务进程,I/O服务进程的数量是用户根据I/O密集程度配置,用于处理计算进程上数据输出的任务。计算进程主要处理数值计算任务,在数值计算过程中生成的所有I/O请求都将转发到服务进程。因此,计算进程可以连续执行,不用等待I/O完成。I/O服务进程在内存中形成一个缓冲池,多次缓冲之后,通过调用底层接口将数据写入文件。本发明可以最大程度上提升I/O密集型应用的I/O性能。
-
-
-
-
-
-
-
-
-