-
公开(公告)号:CN117436370B
公开(公告)日:2024-03-19
申请号:CN202311658183.1
申请日:2023-12-06
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F30/28 , G06F17/13 , G06F17/16 , G06F111/10 , G06F113/08 , G06F119/14
Abstract: 本公开提供了面向流体力学网格生成的超定矩阵方程并行方法及系统,涉及计算流体力学数值模拟技术领域,包括建立以网格顶点坐标值为未知数的超定稀疏矩阵方程;并行获取新的系数矩阵和右端项,各子矩阵矩阵乘、子矩阵子向量乘计算的任务划分策略是按照转置矩阵的行数分给各处理器;采用并行共轭梯度法求解,任务划分策略是以非零元个数作为划分的依据,各个处理器迭代并行计算当前近似解的最优方向、最优步长以及新的近似解,直至残差满足设置的迭代终止条件双检测要求,将最优解作为超定稀疏矩阵方程的网格顶点坐标值,构造出所期望的三维空间结构化网格。本公开提高了高精度应用需求的结构化网格生成能力。
-
公开(公告)号:CN120012426A
公开(公告)日:2025-05-16
申请号:CN202510119252.4
申请日:2025-01-24
Applicant: 齐鲁工业大学(山东省科学院) , 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明提出了一种基于神威架构的迭代求解器优化方法与系统,涉及电子信息技术领域,针对的问题是:目前神威新一代超级计算机中适用于SW26010Pro架构的AztecOO仍然采用双精度算法,存储和计算成本大,AztecOO求解器计算效率低、计算精度低。该方法获取稀疏线性方程组的求解任务,并将所述求解任务下发至主核;主核划分求解任务,并为其分配内存;主核调用从核启动函数,并执行计算;从核将计算结果反馈给主核,得到稀疏线性方程组的解。本发明通过设计的精度选择策略、矩阵分割算和混合精度算法,优化迭代求解器,在保证足够计算精度的情况下,提高算法计算速度,节约内存资源,以加速求解器整个求解过程,为数值计算方面的研究人员提供更高效的开发效率。
-
公开(公告)号:CN117436370A
公开(公告)日:2024-01-23
申请号:CN202311658183.1
申请日:2023-12-06
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F30/28 , G06F17/13 , G06F17/16 , G06F111/10 , G06F113/08 , G06F119/14
Abstract: 本公开提供了面向流体力学网格生成的超定矩阵方程并行方法及系统,涉及计算流体力学数值模拟技术领域,包括建立以网格顶点坐标值为未知数的超定稀疏矩阵方程;并行获取新的系数矩阵和右端项,各子矩阵矩阵乘、子矩阵子向量乘计算的任务划分策略是按照转置矩阵的行数分给各处理器;采用并行共轭梯度法求解,任务划分策略是以非零元个数作为划分的依据,各个处理器迭代并行计算当前近似解的最优方向、最优步长以及新的近似解,直至残差满足设置的迭代终止条件双检测要求,将最优解作为超定稀疏矩阵方程的网格顶点坐标值,构造出所期望的三维空间结构化网格。本公开提高了高精度应用需求的结构化网格生成能力。
-
公开(公告)号:CN118656126A
公开(公告)日:2024-09-17
申请号:CN202410820407.2
申请日:2024-06-24
Applicant: 齐鲁工业大学(山东省科学院) , 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明涉及电子信息技术领域,提供了一种基于神威超级计算机的AztecOO移植优化方法及系统。该方法包括,将Epetra和AztecOO移植到新一代神威超级计算机的主核上;基于移植后主程序的计算热点,采用手动插桩的方式,在主程序内部进行细粒度热点分析,找到计算密集函数,计算密集函数为CSR格式的稀疏矩阵向量乘的子程序;将所述子程序中假定大小数组格式改为固定内存分配方式,调整数组的具体大小;将所述稀疏矩阵中的数据按行等分,平均分配给所有从核,以使从核对分配的数据进行线程级并行计算,达到所述从核能同时完成数据计算的目的;从访存速度和访存带宽两方面进行了从核访存优化,提高了带宽利用率和访存效率,极大提升了程序计算性能。
-
-
-