一种基于神威超级计算机的AztecOO移植优化方法及系统

    公开(公告)号:CN118656126A

    公开(公告)日:2024-09-17

    申请号:CN202410820407.2

    申请日:2024-06-24

    Abstract: 本发明涉及电子信息技术领域,提供了一种基于神威超级计算机的AztecOO移植优化方法及系统。该方法包括,将Epetra和AztecOO移植到新一代神威超级计算机的主核上;基于移植后主程序的计算热点,采用手动插桩的方式,在主程序内部进行细粒度热点分析,找到计算密集函数,计算密集函数为CSR格式的稀疏矩阵向量乘的子程序;将所述子程序中假定大小数组格式改为固定内存分配方式,调整数组的具体大小;将所述稀疏矩阵中的数据按行等分,平均分配给所有从核,以使从核对分配的数据进行线程级并行计算,达到所述从核能同时完成数据计算的目的;从访存速度和访存带宽两方面进行了从核访存优化,提高了带宽利用率和访存效率,极大提升了程序计算性能。

Patent Agency Ranking