-
公开(公告)号:CN115756810A
公开(公告)日:2023-03-07
申请号:CN202211697836.2
申请日:2022-12-28
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种AI能力资源调度方法、系统、设备及存储介质,在AI能力使用场景下,基于AI能力应用负载进行预测,相对于常规的基于资源或者任务预测更合理,并且充分考虑考虑AI能力并发处理能力,AI能力的差异性和服务器集群的异构性,设计新的资源‑负载映射架构,通过提高AI能力的利用率,进而提高服务器资源的利用率,此外,通过AI能力在应用负载预测信息和服务器资源之间进行资源映射,相对于传统方案,更合理地将应用负载信息与AI能力映射而不是直接与服务器资源映射,由于AI能力是应用负载的实际处理单位,因此可以通过提高AI能力的利用率进而间接提高服务器的资源利用率,降低机器成本。