算力资源调度方法、装置、电子设备和存储介质

    公开(公告)号:CN117827456A

    公开(公告)日:2024-04-05

    申请号:CN202311870621.0

    申请日:2023-12-29

    Abstract: 本发明提供算力资源调度方法、装置、电子设备和存储介质,其中方法包括:获取当前时段的算力消耗和各可用区权重分布;基于历史时段的算力消耗和各可用区权重分布,以及所述当前时段的算力消耗和各可用区权重分布,确定下一时段的算力消耗和各可用区权重分布;基于所述各可用区的实时运行数据,以及所述下一时段的算力消耗和各可用区权重分布,生成算力资源调度结果。本发明提供的方法、装置、电子设备和存储介质,能够在保证系统稳定性的同时实现任务快速响应和资源利用效率的最大化,有效提升大模型异构算力的使用率和效率,降低计算资源的浪费。

Patent Agency Ranking