基于深度强化学习的多智能体协同控制方法、系统及介质

    公开(公告)号:CN119717508A

    公开(公告)日:2025-03-28

    申请号:CN202411797219.9

    申请日:2024-12-09

    Abstract: 本发明涉及了一种基于深度强化学习的多智能体协同控制方法、系统及介质,一种基于深度强化学习的多智能体协同控制方法,包括:智能体获取初始化当前状态,将当前状态输入Actor网络,由环境返回给智能体当前状态执行当前动作所获得的奖励和转移到的下一状态;初始化经验缓冲池;智能体初始化采样概率,并将当前动作的轨迹数据和当前动作的轨迹重要程度储存到经验缓冲池中;智能体按经验的重要程度,从经验缓冲池中选取预设数量个批次具有重要程度超过预设阈值的轨迹;更新Actor网络和Critic网络;利用已更新的模型与环境交互得到一条轨迹。本发明解决随智能体数量的增加而引起的环境不稳定,导致多智能体在联合行动空间中存在一定的困难的问题。

Patent Agency Ranking