电力潮流计算的稀疏三角矩阵异构并行求解方法及系统

    公开(公告)号:CN119006221B

    公开(公告)日:2025-02-14

    申请号:CN202411487280.3

    申请日:2024-10-24

    Abstract: 本发明属于分布式计算相关技术领域,为了解决现有没有充分利用计算资源来求解稀疏三角矩阵的问题,提出了电力潮流计算的稀疏三角矩阵异构并行求解方法及系统,根据稀疏三角矩阵中方程之间的依赖关系,构建有向无环图;将有向无环图中存在依赖关系的任务节点进行分层处理,得到用于并行处理的图层;根据每个图层中非零元素的数量进行分块处理,得到矩阵块;基于灵活局部性调度策略,根据父节点所在从核簇的算力情况,判断当前调度矩阵块是否调度至其父节点相邻的从核上,并结合轮询调度策略对矩阵块进行分配;进而稀疏三角求解结果。充分利用分布式系统计算资源,提高计算的准确性和实时性。

    一种基于神威超级计算机的AztecOO移植优化方法及系统

    公开(公告)号:CN118656126A

    公开(公告)日:2024-09-17

    申请号:CN202410820407.2

    申请日:2024-06-24

    Abstract: 本发明涉及电子信息技术领域,提供了一种基于神威超级计算机的AztecOO移植优化方法及系统。该方法包括,将Epetra和AztecOO移植到新一代神威超级计算机的主核上;基于移植后主程序的计算热点,采用手动插桩的方式,在主程序内部进行细粒度热点分析,找到计算密集函数,计算密集函数为CSR格式的稀疏矩阵向量乘的子程序;将所述子程序中假定大小数组格式改为固定内存分配方式,调整数组的具体大小;将所述稀疏矩阵中的数据按行等分,平均分配给所有从核,以使从核对分配的数据进行线程级并行计算,达到所述从核能同时完成数据计算的目的;从访存速度和访存带宽两方面进行了从核访存优化,提高了带宽利用率和访存效率,极大提升了程序计算性能。

    面向电磁场有限元分析的GCN自适应重排序方法及系统

    公开(公告)号:CN118260991A

    公开(公告)日:2024-06-28

    申请号:CN202410343688.7

    申请日:2024-03-25

    Abstract: 本发明涉及计算机处理技术领域,提供了一种面向电磁场有限元分析的GCN自适应重排序方法及系统。该方法包括,基于电磁场的相关数据,构建电磁矩阵;电磁矩阵转换成图数据结构,提取图数据结构的边特征集和顶点特征集;基于边特征集、顶点特征集和附加特征,采用双层GCN模型,在每层均聚合相邻节点的信息,得到每一层的输出特征图,预测最佳重排序算法的索引,并融合每一层的输出特征图,得到融合特征图;将融合特征图和附加特征输入第一层MLP,得到第一特征图;基于第一特征图,采用第二层MLP,得到第二特征图;基于第二特征图,采用第三层MLP,得到第三特征图;将第三特征图经过全连接层及归一化层,得到电磁矩阵的重排序结果。

    求解旅行商问题的MMAS算法并行优化方法及系统

    公开(公告)号:CN117787523A

    公开(公告)日:2024-03-29

    申请号:CN202311850022.2

    申请日:2023-12-28

    Abstract: 本发明提出了求解旅行商问题的MMAS算法并行优化方法及系统,涉及并行优化技术领域。包括根据sw26010pro众核处理器的物理结构,设计一级并行MMAS算法模型,将总种群按照进程数分成若干个子种群,每一子种群对应一个进程;划分主进程和多个从属进程,将执行主进程的核组作为主核组,将执行从属进程的核组作为从属核组,多个从属核组之间为进程级并行;主核组负责管理全局信息,同时控制执行从属任务的从属核组,从属核组分别构建旅行路线,得到局部最佳路径,与主核组之间进行信息迭代,直至满足迭代停止条件,得到全局最佳路径。本发明加速了TSP问题的求解,从而满足求解较大规模旅行商问题的实际需求。

    传热设备热传导的三对角异构众核并行求解方法及系统

    公开(公告)号:CN116227164A

    公开(公告)日:2023-06-06

    申请号:CN202310066558.9

    申请日:2023-01-12

    Abstract: 本发明公开了一种传热设备热传导的三对角异构众核并行求解方法及系统,涉及计算机处理技术领域。包括步骤:采集传热设备的热传导参数,建立传热模型;输入热传导参数至传热模型,构建热传导方程;通过差分和转化得到关于热传导的三对角线性方程组;通过并行消元的方法对三对角矩阵方程数据消除数据依赖;抽取部分组成小型三对角矩阵方程;采用追赶法求解缩减三对角矩阵方程;将各个进程以任务并行的方式回代输出三对角矩阵方程剩余全部解;并根据求解结果绘制温度变化曲线,获得热传导过程的温度变化。解决了传热设备热传导现象模拟仿真过程中,需要求解的三对角矩阵方程规模较大,导致热传导过程的分析过程耗时较长,结果不够准确的问题。

    一种面向电磁有限元方程组的并行迭代求解方法及系统

    公开(公告)号:CN119474622B

    公开(公告)日:2025-03-14

    申请号:CN202510059378.7

    申请日:2025-01-15

    Abstract: 本公开提供了一种面向电磁有限元方程组的并行迭代求解方法及系统,涉及电磁有限元技术领域,包括:构建待求解的电磁有限元方程组#imgabs0#;将电磁有限元方程组划分为多个计算子任务,将子任务的子矩阵块#imgabs1#和子右端项向量#imgabs2#分配给超级计算机中的各进程;利用初始化后的Householder‑GMRES算法,各进程并行进行子任务的计算,得到各进程的局部最优解#imgabs3#;对各进程的局部最优解#imgabs4#进行汇总,得到电磁有限元方程组的最优解#imgabs5#;本发明将电磁有限元、Householder‑GMRES算法、并行计算三者结合起来,利用并行优化技术提高电磁有限元线性方程组求解效率。

    一种基于申威众核处理器的主核与核组之间通信锁同步运行加速方法

    公开(公告)号:CN110262900A

    公开(公告)日:2019-09-20

    申请号:CN201910536896.8

    申请日:2019-06-20

    Abstract: 本发明涉及一种基于申威众核处理器的主核与核组之间通信锁同步运行加速方法,包括步骤如下:A、判断程序段A、程序段B、程序段C之间的程序上下文依赖关系;如果程序段A、程序段B、程序段C三者之间都存在程序上下文依赖关系,则顺序执行;否则,调整程序段A、程序段B、程序段C之间的执行顺序,进行执行;B、对连续的后三段程序段执行步骤A直至执行完所有的程序。本发明判断程序段之间的程序上下文依赖关系,分情况灵活处理,还引入了“通信锁”同步机制,节省了主核等待时间,实现了主核和核组的并行处理,程序执行过程中,减少了对spawn和join核组线程的需要次数,提高了程序的执行效率。

    一种面向电磁有限元方程组的并行迭代求解方法及系统

    公开(公告)号:CN119474622A

    公开(公告)日:2025-02-18

    申请号:CN202510059378.7

    申请日:2025-01-15

    Abstract: 本公开提供了一种面向电磁有限元方程组的并行迭代求解方法及系统,涉及电磁有限元技术领域,包括:构建待求解的电磁有限元方程组#imgabs0#;将电磁有限元方程组划分为多个计算子任务,将子任务的子矩阵块#imgabs1#和子右端项向量#imgabs2#分配给超级计算机中的各进程;利用初始化后的Householder‑GMRES算法,各进程并行进行子任务的计算,得到各进程的局部最优解#imgabs3#;对各进程的局部最优解#imgabs4#进行汇总,得到电磁有限元方程组的最优解#imgabs5#;本发明将电磁有限元、Householder‑GMRES算法、并行计算三者结合起来,利用并行优化技术提高电磁有限元线性方程组求解效率。

Patent Agency Ranking