一种基于神威架构的迭代求解器优化方法及系统

    公开(公告)号:CN120012426A

    公开(公告)日:2025-05-16

    申请号:CN202510119252.4

    申请日:2025-01-24

    Abstract: 本发明提出了一种基于神威架构的迭代求解器优化方法与系统,涉及电子信息技术领域,针对的问题是:目前神威新一代超级计算机中适用于SW26010Pro架构的AztecOO仍然采用双精度算法,存储和计算成本大,AztecOO求解器计算效率低、计算精度低。该方法获取稀疏线性方程组的求解任务,并将所述求解任务下发至主核;主核划分求解任务,并为其分配内存;主核调用从核启动函数,并执行计算;从核将计算结果反馈给主核,得到稀疏线性方程组的解。本发明通过设计的精度选择策略、矩阵分割算和混合精度算法,优化迭代求解器,在保证足够计算精度的情况下,提高算法计算速度,节约内存资源,以加速求解器整个求解过程,为数值计算方面的研究人员提供更高效的开发效率。

    一种基于神威超级计算机的AztecOO移植优化方法及系统

    公开(公告)号:CN118656126A

    公开(公告)日:2024-09-17

    申请号:CN202410820407.2

    申请日:2024-06-24

    Abstract: 本发明涉及电子信息技术领域,提供了一种基于神威超级计算机的AztecOO移植优化方法及系统。该方法包括,将Epetra和AztecOO移植到新一代神威超级计算机的主核上;基于移植后主程序的计算热点,采用手动插桩的方式,在主程序内部进行细粒度热点分析,找到计算密集函数,计算密集函数为CSR格式的稀疏矩阵向量乘的子程序;将所述子程序中假定大小数组格式改为固定内存分配方式,调整数组的具体大小;将所述稀疏矩阵中的数据按行等分,平均分配给所有从核,以使从核对分配的数据进行线程级并行计算,达到所述从核能同时完成数据计算的目的;从访存速度和访存带宽两方面进行了从核访存优化,提高了带宽利用率和访存效率,极大提升了程序计算性能。

Patent Agency Ranking