-
公开(公告)号:CN119292663A
公开(公告)日:2025-01-10
申请号:CN202411318616.3
申请日:2024-09-20
Applicant: 济南超级计算中心有限公司
IPC: G06F8/76 , G06N3/084 , G06N3/0499
Abstract: 本公开提供了基于申威处理器Transformer移植的高性能并行实现方法,涉及处理器计算并行实现技术领域,使用申威Athread编程方法进行从核计算,将ViT算法的前向传播和后向传播的各个单独函数改写为统一的函数,并简化前向函数中的计算中间变量,实现ViT算法的移植运行;简化前向函数计算过程的中间变量,将基于Transformer架构ViT算法成功地在国产申威处理器上进行移植运行,通过优化算法去除不必要的冗余计算,显著提升了视觉Transformer(ViT)模型在神威超级计算机上的运行效率。
-
公开(公告)号:CN117591173A
公开(公告)日:2024-02-23
申请号:CN202311405503.2
申请日:2023-10-26
Applicant: 济南超级计算中心有限公司
Abstract: 本发明公开了一种基于申威处理器的Code_Saturne移植方法及系统,包括:对Code_Saturne进行改进,包括configure的改写、获取euid代码的修改及依赖库的动态连接;对改进后的Code_Saturne进行编译,生成可执行文件;在申威处理器上运行生成的可执行文件。解决了申威处理器上常见的库在configure有时检测不到具体位置的问题,避免了编译时找不到库文件或链接时出现错误;解决了申威处理器和x86机器使用不同的动态链接器时导致在运行时无法找到依赖的库的问题;还解决了软件在申威处理器上无法正确获取系统号以及即使获取系统号也没有对应的并行策略而导致运行时出现的问题和计算节点宕机的问题。
-
公开(公告)号:CN116257338A
公开(公告)日:2023-06-13
申请号:CN202211728123.8
申请日:2022-12-29
Applicant: 济南超级计算中心有限公司
Abstract: 本公开提供了一种Blender渲染在神威超算中的并行优化方法及系统,包括:获取Blender待渲染任务的渲染场景数据,并对所述渲染场景数据进行分割,其中,分割的数量基于神威超算中节点的核组数目确定;对于分割后的渲染场景数据,分别采用独立进程利用不同核组的计算资源进行场景渲染;其中,每个核组对应一个独立进程;当所有独立进程均计算完毕,将各个核组的渲染结果进行合并,获得最终的渲染结果;其中,针对Blender渲染计算过程中开启降噪功能的情况,采用数据重叠区的方式解决数据依赖问题。
-
公开(公告)号:CN115454665A
公开(公告)日:2022-12-09
申请号:CN202211011500.6
申请日:2022-08-23
Applicant: 济南超级计算中心有限公司
Abstract: 本发明提出了一种面向超算集群调度的通用作业收集方法及中间件,涉及集群调度技术领域,用于解决不同调度系统数据接口不兼容的问题以及同一调度系统不同版本数据接口不兼容的问题,该方法包括:采用主动收集和被动收集两种模式获取各个超算集群调度系统的作业信息;对获取的作业信息进行解析,生成结构化数据;将生成的结构化数据存储在不同的用户介质中;本发明采用部分策略模式、适配器模式的思想,遵守编码的五大设计原则(单一职责原则、开闭原则、里氏替换原则、接口分离原则、依赖反转原则),以一种非侵入性、可拔插的形式,在不修改S l urm或其他调度系统本身代码的前提下,保证旧有集群的稳定性、健壮性。
-
-
-