电力矩阵LU分解加速方法、装置、设备及存储介质

    公开(公告)号:CN116862750A

    公开(公告)日:2023-10-10

    申请号:CN202310827171.0

    申请日:2023-07-06

    IPC分类号: G06T1/20 G06T1/60 G06F17/16

    摘要: 本发明涉及电力系统高性能计算技术领域,公开了电力矩阵LU分解加速方法、装置、设备及存储介质,方法包括:根据电力矩阵中列与列之间的依赖关系,对电力矩阵进行分层处理,得到多个层级;层级中包含一个或多个列;根据每个层级的列数量,从多个处理单元中确定对应层级中每一列的目标处理单元,以及每一列的目标处理单元的预设数量;列数量表示对应层级中列的数量,多个处理单元包括CUDA线程、CUDA线程束或者CUDA流;分别对对应层级中的每一列采取预设数量的目标处理单元,预设数量的目标处理单元用于对对应层级中的每一列执行LU分解。本发明能够根据电力矩阵特性,对GPU资源进行灵活调整,从而达到提高电力矩阵LU分解在GPU上的计算速度的目的。

    面向异构计算资源的深度强化学习协同调度方法及装置

    公开(公告)号:CN117909044A

    公开(公告)日:2024-04-19

    申请号:CN202410033480.5

    申请日:2024-01-09

    IPC分类号: G06F9/48 G06F9/50 G06N3/092

    摘要: 本发明涉及人工智能算力资源调度技术领域,公开了面向异构计算资源的深度强化学习协同调度方法及装置,该方法包括:获取深度学习任务以及异构计算环境信息,异构计算环境为云边协同环境;根据深度学习任务以及异构计算环境信息构建任务调度模型;采用基于深度强化学习的任务调度算法根据任务调度模型对深度学习任务进行调度。本发明实现了在调度过程中考虑深度学习任务以及异构计算环境信息的目的,利用构建的任务模型采用基于深度强化学习的任务调度算法对深度学习任务进行调度,达到了充分利用反馈信息、提高深度学习任务协同调度的灵活性、实时性、泛化能力以及自适应性的效果,解决了相关技术中存在的深度学习任务调度质量较差的问题。