面向深度强化学习模型训练的异构算力资源配置优化方法

    公开(公告)号:CN119271398A

    公开(公告)日:2025-01-07

    申请号:CN202411293615.8

    申请日:2024-09-14

    Abstract: 发明公开了面向深度强化学习模型训练的异构算力资源配置优化方法,针对model‑based Muzero系列算法的核心组件,构建了一个异构图来描述组件的特征以及数据流动关系,基于多头注意力的节点‑边编码器将节点和边的特征映射到同一隐藏空间,利用汇总的全局特征预测不同配置下的算法训练时间。再利用模拟退火算法,根据模型输出的预测训练时间进行配置优化。根据优化后的配置分配CPU资源、GPU资源和内存资源,进行训练任务。根据训练结果计算资源均衡因子,评估资源配置方案,持续监控与优化。该方法实现模型训练过程中性能与资源消耗间的最佳平衡,显著提升模型训练的效率和效果,降低了复杂场景下资源配置优化的技术难度。

Patent Agency Ranking