一种GPU算力资源的调度方法、装置

    公开(公告)号:CN118885273A

    公开(公告)日:2024-11-01

    申请号:CN202411047342.9

    申请日:2024-07-31

    Abstract: 一种GPU算力资源的调度方法,包括:响应于在计算集群中创建的目标计算任务,确定所述目标计算任务的任务类型;如果所述目标计算任务为所述第一类计算任务,将所述目标计算任务调度至所述计算集群中的剩余算力资源满足所述目标计算任务的算力需求的第一GPU硬件进行运行;响应于搭载所述第一GPU硬件的第一计算节点上报的所述第一类计算任务将独占所述第一GPU硬件的算力资源的第一指示,将已调度至所述第一GPU硬件进行运行的所述第二类计算任务,重新调度至所述计算集群中的剩余算力资源满足所述第二类计算任务的算力需求的第二GPU硬件进行运行;所述第一类计算任务的服务等级高于所述第二类计算任务。

Patent Agency Ranking