一种基于神威架构的迭代求解器优化方法及系统

    公开(公告)号:CN120012426A

    公开(公告)日:2025-05-16

    申请号:CN202510119252.4

    申请日:2025-01-24

    Abstract: 本发明提出了一种基于神威架构的迭代求解器优化方法与系统,涉及电子信息技术领域,针对的问题是:目前神威新一代超级计算机中适用于SW26010Pro架构的AztecOO仍然采用双精度算法,存储和计算成本大,AztecOO求解器计算效率低、计算精度低。该方法获取稀疏线性方程组的求解任务,并将所述求解任务下发至主核;主核划分求解任务,并为其分配内存;主核调用从核启动函数,并执行计算;从核将计算结果反馈给主核,得到稀疏线性方程组的解。本发明通过设计的精度选择策略、矩阵分割算和混合精度算法,优化迭代求解器,在保证足够计算精度的情况下,提高算法计算速度,节约内存资源,以加速求解器整个求解过程,为数值计算方面的研究人员提供更高效的开发效率。

    电力潮流计算的稀疏三角矩阵异构并行求解方法及系统

    公开(公告)号:CN119006221A

    公开(公告)日:2024-11-22

    申请号:CN202411487280.3

    申请日:2024-10-24

    Abstract: 本发明属于分布式计算相关技术领域,为了解决现有没有充分利用计算资源来求解稀疏三角矩阵的问题,提出了电力潮流计算的稀疏三角矩阵异构并行求解方法及系统,根据稀疏三角矩阵中方程之间的依赖关系,构建有向无环图;将有向无环图中存在依赖关系的任务节点进行分层处理,得到用于并行处理的图层;根据每个图层中非零元素的数量进行分块处理,得到矩阵块;基于灵活局部性调度策略,根据父节点所在从核簇的算力情况,判断当前调度矩阵块是否调度至其父节点相邻的从核上,并结合轮询调度策略对矩阵块进行分配;进而稀疏三角求解结果。充分利用分布式系统计算资源,提高计算的准确性和实时性。

    面向浅水方程的pcg申威众核优化方法及系统

    公开(公告)号:CN117707785A

    公开(公告)日:2024-03-15

    申请号:CN202311870609.X

    申请日:2023-12-28

    Abstract: 本发明提出了面向浅水方程的pcg申威众核优化方法及系统,涉及数据处理技术领域。包括读取系数矩阵和右端项,设定基本条件;在管理核心中,基于整行对系数矩阵进行数据划分,在行方向上进行均匀分块,得到分块数据;对计算核心的LDM均匀划分两个分区,将分块数据分多次传输至计算核心,两个分区并行实现传输和计算过程;将同一核组内各计算核心计算后的数据进行求和,放入共享内存区域中,由指定计算核心再次求和后比较残差,判断是否满足残差下降要求。本发明使用基于行的划分方法、两级并行、避免通信等方法加快计算速度,针对浅水方程提供了高效的对角预条件PCG在神威超级计算机上的实现方式。

Patent Agency Ranking