-
公开(公告)号:CN118245118A
公开(公告)日:2024-06-25
申请号:CN202410679259.7
申请日:2024-05-29
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F9/38
Abstract: 本发明涉及一种基于新一代申威众核处理器从核局存受限优化方法,属于电子信息的技术领域,包括:针对依赖数据占用存储小于共享LDM最大存储空间的情况,主核提前计算循环中的依赖部分,并将计算得出的依赖数据存储在数组中,从核通过DMA或者共享LDM空间DMA方式从主核获取依赖数据,完成计算;针对依赖数据占用存储不小于共享LDM最大存储空间的情况,在主核中构建一个哈希表,主核提前计算循环中的依赖部分,并将计算得出的依赖数据存储在哈希表中;从核通过DMA或者共享LDM空间DMA方式获取哈希表,从而获取所需的依赖数据,完成计算。本发明将预先计算好的依赖部分分配给从核执行,从而有效提高程序的效率。
-
公开(公告)号:CN118012818A
公开(公告)日:2024-05-10
申请号:CN202410428041.4
申请日:2024-04-10
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F15/173 , G06F9/54
Abstract: 本发明涉及一种基于新一代申威众核处理器的进程间通信优化方法;属于电子信息的技术领域,将芯片内的核组划分不同的进程通信域;包括芯片之间的通信优化和芯片内部的通信优化;芯片之间的通信优化,包括:划分通信域;划分进程,将不同的进程分配到不同的通信域中;不同进程根据数据使用规律和机器硬件架构划分到不同的通信域;在不同的通信域中同时进行不同的进程间通信操作;芯片内部的通信优化,包括:对于不同类型的进程间通信操作,由一个特定的核组编号的进程在交叉段上申请一片空间,在同一芯片上的不同核组分别向交叉段中特定位置同时添加数据,在所有进程间执行一次同步。本发明为不同类型的进程通信操作提供了不同的方法。
-
公开(公告)号:CN115952385B
公开(公告)日:2023-05-05
申请号:CN202310224172.6
申请日:2023-03-10
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明公开了一种用于大规模稀疏方程组求解的并行超节点排序方法及系统,涉及高性能计算技术领域,针对在稀疏矩阵LU分解过程中生成的超级节点块状矩阵,基于二维进程网格,按照块状矩阵的行和列循环映射矩阵数据,将该块状矩阵的上三角部分数据通过转置映射到处理下三角部分数据的进程中,同时采用动态分配资源的策略,根据实际映射到进程的行矩阵块的数量,为每个进程网格中的进程分配内存,以此节省大量的内存空间,提高内存扩展性,并提高稀疏矩阵求解的规模扩展性,解决现有排序方法无法适用于求解大规模稀疏线性方程组的问题。
-
公开(公告)号:CN114970294B
公开(公告)日:2022-10-25
申请号:CN202210922499.6
申请日:2022-08-02
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明属于数据处理技术领域,提供了基于神威架构的三维应变仿真PCG并行优化方法及系统,该方案通过对弹性体三维应变仿真PCG迭代算法数据划分优化、从核访存优化、双缓冲优化策略、任务并行与数据并行结合优化、从核间RMA通信优化,该方法为针对神威新一代超算平台开发、移植或优化应变弹性固体的平衡仿真程序的开发人员提供了一种通用的优化方法。
-
公开(公告)号:CN113703952A
公开(公告)日:2021-11-26
申请号:CN202010429029.7
申请日:2020-05-20
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F9/50
Abstract: 本发明涉及一种基于超级计算机的队列资源调度的资源分配方法,包括:(1)用户提交作业,指定计算资源数目与私人队列名;(2)提交的参数发送至系统判定,如果私人队列资源够使用,即私人队列资源中的资源数目大于计算资源数目,则用户作业正常运算,结束;否则,系统判断是否符合条件;提交的参数是指用户指定的计算资源数目与私人队列名;(3)如果符合条件,则将需要的临时节点从资源池中划分到中私人队列名对应的私人队列中,用户作业正常运算完成;否则,打印出不符合条件的理由;(4)系统将临时节点重新划回到资源池中,结束。本发明优化计算资源配置,提高效率。可以保持一个旺盛的资源队列,以供紧急时刻的资源调用。
-
公开(公告)号:CN119917297A
公开(公告)日:2025-05-02
申请号:CN202510418421.4
申请日:2025-04-03
Applicant: 齐鲁工业大学(山东省科学院) , 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种基于多处理器协同系统的自适应任务调度方法,属于电子信息的技术领域。包括:执行CPU‑GPU任务调度;计算得到CPU和GPU的各自数据量分配,并存入文本;根据得到的CPU和GPU的各自数据量分配,CPU和GPU进行并行计算;CPU数据和GPU数据汇总,输出结果,结束;从文本中读取历史数据到数组;读取数组数据,获得CPU和GPU的各自数据量分配;数组数据利用最小二乘法构建线性回归方程,得到预测结果。本发明设计了新的任务调度方法,可以高效地找到CPU和GPU执行任务的均衡点并合理分配任务。本发明结合了数组和线性回归模型,利用历史数据和预测模型,可以更好地减少任务调度的额外耗时。
-
公开(公告)号:CN119045897B
公开(公告)日:2025-03-21
申请号:CN202411554666.1
申请日:2024-11-04
Applicant: 齐鲁工业大学(山东省科学院) , 山东省计算中心(国家超级计算济南中心)
IPC: G06F9/38 , G06F9/448 , G06F13/28 , G06F15/173
Abstract: 本发明涉及一种基于新一代申威众核处理器从核输出乱序优化方法,属于电子信息的技术领域,包括:首先,在从核阵列中选择出1个监管从核和63个计算从核,计算从核对数据进行计算后,将得到的数据量通过RMA传输给监管从核;其次,监管从核对数据量进行汇总,并将得到的总数据量通过DMA传输给主核,主核根据总数据量构建存储数组;同时,监管从核根据数据量计算主存地址,并将得到的主存地址通过RMA广播分配给各个计算从核;最后,计算从核获取到各自相应的主存地址后,通过DMA将存储在LDM中数据传输给存储数组。选择本发明方法进行优化,能有效解决该问题,提高程序执行效率。
-
公开(公告)号:CN118409801B
公开(公告)日:2024-08-30
申请号:CN202410888133.0
申请日:2024-07-04
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F9/38 , G06F9/30 , G06F15/173
Abstract: 本发明涉及基于申威众核处理器的含依赖及交叉循环从核优化方法,属于电子信息的技术领域。包括:对在每次计算周期内存在较大依赖的数据进行预处理,降低依赖数据的依赖强度,即:将最高维度的依赖数据降低到不影响计算的最低维度;将多个步骤的计算过程合并到一次从核组启动到关闭的过程中,并且将从核组再次细化为若干个从核小组,从核小组间采用单指令流多数据流的并行策略,从核小组内采用多指令流多数据流的并行策略;显式管理利用局部数据存储LDM,一次性从主存传入所需要的计算数据。本发明有效降低了一次传入从核LDM中的数据量,节约了LDM的使用空间,降低了传输的带宽压力,增加了LDM使用和数据传输效率。
-
公开(公告)号:CN118245118B
公开(公告)日:2024-07-26
申请号:CN202410679259.7
申请日:2024-05-29
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F9/38
Abstract: 本发明涉及一种基于新一代申威众核处理器从核局存受限优化方法,属于电子信息的技术领域,包括:针对依赖数据占用存储小于共享LDM最大存储空间的情况,主核提前计算循环中的依赖部分,并将计算得出的依赖数据存储在数组中,从核通过DMA或者共享LDM空间DMA方式从主核获取依赖数据,完成计算;针对依赖数据占用存储不小于共享LDM最大存储空间的情况,在主核中构建一个哈希表,主核提前计算循环中的依赖部分,并将计算得出的依赖数据存储在哈希表中;从核通过DMA或者共享LDM空间DMA方式获取哈希表,从而获取所需的依赖数据,完成计算。本发明将预先计算好的依赖部分分配给从核执行,从而有效提高程序的效率。
-
公开(公告)号:CN117632530B
公开(公告)日:2024-05-03
申请号:CN202410100803.8
申请日:2024-01-25
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F9/52 , G06F15/173 , G06F15/78
Abstract: 本发明涉及基于新一代申威众核处理器的从核数量调整并行加速方法,属于电子信息技术领域。包括:定义初始临界资源控制器CRC精确度;在从核访问主存的过程中,通过临界资源控制器CRC控制的形式,以控制多次所得到从核数量对应的平均时间差值为基准,根据时间差值增大或减少的情况进行临界资源控制器CRC精确度大小的调整,在确定临界资源控制器CRC控制的精确度为1时,即比较相邻从核数量所对应的时间,以此得到最佳的时间和最合适的从核数量。本发明解决了从核执行程序段中的数量选择问题。该方法可以快捷、便利地找到最佳的从核数量,有效的降低程序执行的时间,从而提高应用程序的并行效率,可以适用于申威系列众核处理器。
-
-
-
-
-
-
-
-
-