-
公开(公告)号:CN116431329A
公开(公告)日:2023-07-14
申请号:CN202310226362.1
申请日:2023-03-09
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种GPU集群调度方法、装置,所述方法包括:租户提交任务至等待队列;获取集群中各个计算节点上的任务信息;从所述等待队列中选取满足第一预设条件的任务;依据所述任务与计算节点的亲和性,将满足第一预设条件的所述任务调度至选取满足第二预设条件的所述计算节点。该方法在提高GPU集群资源利用率的同时,兼顾多租户的公平性。