-
公开(公告)号:CN117632530A
公开(公告)日:2024-03-01
申请号:CN202410100803.8
申请日:2024-01-25
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F9/52 , G06F15/173 , G06F15/78
Abstract: 本发明涉及基于新一代申威众核处理器的从核数量调整并行加速方法,属于电子信息技术领域。包括:定义初始临界资源控制器CRC精确度;在从核访问主存的过程中,通过临界资源控制器CRC控制的形式,以控制多次所得到从核数量对应的平均时间差值为基准,根据时间差值增大或减少的情况进行临界资源控制器CRC精确度大小的调整,在确定临界资源控制器CRC控制的精确度为1时,即比较相邻从核数量所对应的时间,以此得到最佳的时间和最合适的从核数量。本发明解决了从核执行程序段中的数量选择问题。该方法可以快捷、便利地找到最佳的从核数量,有效的降低程序执行的时间,从而提高应用程序的并行效率,可以适用于申威系列众核处理器。
-
公开(公告)号:CN117632520A
公开(公告)日:2024-03-01
申请号:CN202410100805.7
申请日:2024-01-25
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F9/50 , G06F15/173 , G06F15/78
Abstract: 本发明涉及基于申威众核处理器的主从核监测交互的计算量调度方法,属于电子信息技术领域。包括:在计算量传输过程中,通过从核状态监测器SW‑CSM实现主核对从核状态的判断与监测;通过主从核协作交互器MCCI实现将计算量均匀分配到每个从核中,完成主从核监测交互的计算量调度。本发明根据单个核组内的资源配置情况,针对因计算量不同而导致的负载不均衡问题,解决了主从核交互过程中执行程序段中的计算量分配问题。该方法可以快捷、便利地实现申威众核处理器主从核交互过程中计算量的均匀分配问题,有效的降低程序执行的时间,从而提高应用程序的并行效率。该方法可以适用于申威系列众核处理器。
-
公开(公告)号:CN117033026A
公开(公告)日:2023-11-10
申请号:CN202311038791.2
申请日:2023-08-17
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F9/54
Abstract: 本发明涉及一种基于新一代神威超级计算机硬件架构的多层次集合通信的优化方法,包括:根据应用程序所使用的进程数不同,确定应用程序属于哪一种情况;根据新一代神威超级计算机的硬件架构,对不同情况内的1对N型、N对1型、N对N型集合通信函数进行优化,包括:通过进程分组,在各组内进行集合通信,用下层架构中的通信来代替上层架构中的通信。本发明考虑到应用程序所需要的进程数存在多种情况以及实际可供使用的资源,在多种情况下进行了测试。本发明方法在实际使用时所受的进程资源的限制,提供了处理不同资源限制下的方法,减少了使用难度,提高了用户体验。经过本发明方法优化后的集合通信函数拥有明显的加速效果。
-
公开(公告)号:CN113703952B
公开(公告)日:2023-10-10
申请号:CN202010429029.7
申请日:2020-05-20
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F9/50
Abstract: 本发明涉及一种基于超级计算机的队列资源调度的资源分配方法,包括:(1)用户提交作业,指定计算资源数目与私人队列名;(2)提交的参数发送至系统判定,如果私人队列资源够使用,即私人队列资源中的资源数目大于计算资源数目,则用户作业正常运算,结束;否则,系统判断是否符合条件;提交的参数是指用户指定的计算资源数目与私人队列名;(3)如果符合条件,则将需要的临时节点从资源池中划分到中私人队列名对应的私人队列中,用户作业正常运算完成;否则,打印出不符合条件的理由;(4)系统将临时节点重新划回到资源池中,结束。本发明优化计算资源配置,提高效率。可以保持一个旺盛的资源队列,以供紧急时刻的资源调用。
-
公开(公告)号:CN115587279A
公开(公告)日:2023-01-10
申请号:CN202110755290.0
申请日:2021-07-05
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种基于超大规模稀疏矩阵分布式读取减少单节点内存的方法及系统,超大规模稀疏矩阵通过Rutherford‑Boeing格式存储,包括:(1)为了矩阵运算方便和利于并行,将Rutherford‑Boeing格式转为行压缩,以行压缩格式存储数据;(2)节点计算各自分块矩阵行压缩的行指针、列索引以及非零元值;(3)节点将计算得到的各自行指针、列索引以及非零元值以行压缩格式写入各自文件;(4)当应用需要超大规模稀疏矩阵时,节点从各自文件中读取数据,结束。本发明多节点并行读入时,读取速度快,节点之间不用再分发数据,避免了通信拥挤,提升了整体性能。
-
公开(公告)号:CN114968374A
公开(公告)日:2022-08-30
申请号:CN202210849632.X
申请日:2022-07-19
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
Abstract: 本发明涉及一种基于新一代神威超级计算机的多层循环进程级和线程级协同自动优化方法,包括:将应用程序中的多层循环程序段和硬件架构相互对应,实现各层循环到硬件架构上的代码级映射;根据硬件架构层次不同,分别进行进程级和线程级的并行优化,其中,进程级优化即节点内通信优化和节点间的通信优化,使得各个进程在各自通信域中进行集中通信,减少程序优化过程中各个进程之间的通信;线程级优化即核组内主从传输优化。本发明提高了运行效率。
-
公开(公告)号:CN110262884A
公开(公告)日:2019-09-20
申请号:CN201910536853.X
申请日:2019-06-20
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及一种基于申威众核处理器的核组内多程序多数据流分区并行的运行方法,本发明根据不同程序段之间的依赖关系,将多个可并行优化程序段放入同一核组执行,在同一核组内部,可以选择同步或者异步执行多个程序段;根据同一程序段内不同程序子段之间的依赖关系,在同一核组内部,可以选择并行执行多个程序子段。此种方法可以减少核组spawn与join的次数,减少主核与核组之间DMA传输的次数,重复利用核组中的数据,从而提高程序的运行效率。
-
公开(公告)号:CN119271619B
公开(公告)日:2025-03-28
申请号:CN202411803189.8
申请日:2024-12-10
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F15/173 , G06F9/48
Abstract: 本发明涉及基于申威众核处理器的核组内多线程优化方法及系统,属于电子信息技术领域;包括:(1)数据预处理;将任务中含有依赖的运算任务和可从核化的计算任务分隔开;(2)主核与从核协助处理;根据原计算任务的计算逻辑,将含有依赖的运算任务和可从核化的计算任务分别交由主核和从核处理,实现核组内多指令流多数据流的并行运行;(3)从核计算优化;在从核LDM中申请一块单独的区域用以存储中间结果;另外申请一部分主存空间,用来接收从核计算结果;在核组内所有线程均达到预定的结束位置时,再将运算的结果进行合并。本发明避免了多次数据传输造成的计算中断和数据错误,有效增强了从核函数的独立性,提高了计算效率。
-
公开(公告)号:CN119292794A
公开(公告)日:2025-01-10
申请号:CN202411826361.1
申请日:2024-12-12
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F9/50 , G06F9/54 , G06F15/167 , G06F15/177 , G06F15/78 , G06F13/28 , G06F18/27
Abstract: 本发明涉及基于新一代申威处理器计算资源受限与通信冗余优化方法,属于电子信息技术领域。包括:首先,对热点计算部分进行分析,判断热点计算部分循环次数与计算量需要的核组的数量;其中,计算部分的代码运行时间占总代码运行时间一半以上,则判定该计算部分为热点计算部分;然后,多核组申请与编号,让多核组对热点计算部分进行协同计算;再次,在协同计算完成后,对核组内的从核进行分组,优化对数据的收集、传输,核组间再进行数据收集、传输;最后,将最终结果单次传回主存。本发明通过申请多核组协同优化,使得从核优化能够利用更多的计算资源,大大提升了程序的执行效率。
-
公开(公告)号:CN119271619A
公开(公告)日:2025-01-07
申请号:CN202411803189.8
申请日:2024-12-10
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F15/173 , G06F9/48
Abstract: 本发明涉及基于申威众核处理器的核组内多线程优化方法及系统,属于电子信息技术领域;包括:(1)数据预处理;将任务中含有依赖的运算任务和可从核化的计算任务分隔开;(2)主核与从核协助处理;根据原计算任务的计算逻辑,将含有依赖的运算任务和可从核化的计算任务分别交由主核和从核处理,实现核组内多指令流多数据流的并行运行;(3)从核计算优化;在从核LDM中申请一块单独的区域用以存储中间结果;另外申请一部分主存空间,用来接收从核计算结果;在核组内所有线程均达到预定的结束位置时,再将运算的结果进行合并。本发明避免了多次数据传输造成的计算中断和数据错误,有效增强了从核函数的独立性,提高了计算效率。
-
-
-
-
-
-
-
-
-