一种基于神威架构的迭代求解器优化方法及系统

    公开(公告)号:CN120012426A

    公开(公告)日:2025-05-16

    申请号:CN202510119252.4

    申请日:2025-01-24

    Abstract: 本发明提出了一种基于神威架构的迭代求解器优化方法与系统,涉及电子信息技术领域,针对的问题是:目前神威新一代超级计算机中适用于SW26010Pro架构的AztecOO仍然采用双精度算法,存储和计算成本大,AztecOO求解器计算效率低、计算精度低。该方法获取稀疏线性方程组的求解任务,并将所述求解任务下发至主核;主核划分求解任务,并为其分配内存;主核调用从核启动函数,并执行计算;从核将计算结果反馈给主核,得到稀疏线性方程组的解。本发明通过设计的精度选择策略、矩阵分割算和混合精度算法,优化迭代求解器,在保证足够计算精度的情况下,提高算法计算速度,节约内存资源,以加速求解器整个求解过程,为数值计算方面的研究人员提供更高效的开发效率。

    基于微架构参数的处理器性能模型构建方法及系统

    公开(公告)号:CN118227442A

    公开(公告)日:2024-06-21

    申请号:CN202410442884.X

    申请日:2024-04-12

    Abstract: 本发明公开一种基于微架构参数的处理器性能模型构建方法及系统,涉及处理器性能建模技术领域,方法为:获取处理器运行作业时的微架构参数;将微架构参数中的作业运行时间作为因变量、硬件微观结构参数作为自变量、本地计算特征参数作为辅助变量,初步构建基于线性部分和非线性部分的性能模型;以自变量和辅助变量之间的相关性为权重改进线性部分,结合梯度下降法优化改进的线性部分;动态设定自变量的组合和幂次范围,并引入自变量的对数项,利用多项式特征转换,结合ElasticNetCV模型和粒子群优化算法,优化非线性部分;以此搭建最终的性能模型。本发明能够更好的量化作业运行性能,应对复杂的数据情况,精确预测作业运行时间。

Patent Agency Ranking