-
公开(公告)号:CN117471974A
公开(公告)日:2024-01-30
申请号:CN202311562445.4
申请日:2023-11-20
申请人: 中国人民解放军战略支援部队信息工程大学
IPC分类号: G05B19/042
摘要: 本发明公开一种基于分层和DDPG的多智能体集群运动方法,包括:采用五元组建立多智能体集群运动任务模型;设计多智能体分层控制方案;定义动作空间、状态空间和奖励函数;基于多智能体分层控制方案、动作空间、状态空间、奖励函数和DDPG设计多智能体集群运动算法进行训练;使用训练完成的网络模型实现多智能体集群运动。本发明针对通信距离较短的环境,提出了领导者‑跟随者的分层控制方案,基于DDPG算法设计了针对不同层级的跟随者的深度强化学习算法,通过对多智能体的分布式控制实现了跟随者向领导者聚集并跟随其运动,解决了在通信距离较短时通信拓扑易断开的问题。
-
公开(公告)号:CN118276492A
公开(公告)日:2024-07-02
申请号:CN202410423057.6
申请日:2024-04-09
申请人: 中国人民解放军战略支援部队信息工程大学
IPC分类号: G05B19/042
摘要: 本发明属于无人机集群和深度强化学习技术领域,特别涉及一种基于SAC的无人机集群通信网络拓扑控制方法及系统,该方法包括初步构建无人机集群通信网络拓扑;获得2‑连通无人机集群通信网络拓扑;定义基于SAC的无人机集群通信网络拓扑控制算法的动作空间、状态空间和奖励函数;设计基于SAC的无人机集群通信网络拓扑控制算法并训练网络模型;使用训练完成的网络模型得到优化的2‑连通无人机集群通信网络拓扑。本发明提出的基于SAC的无人机集群通信网络拓扑控制算法首先为每个无人机确定2个目标无人机,然后每个无人机通过移动位置与2个目标无人机保持连通,同时与通信范围内的其他无人机保持安全距离,最终得到了具有连通性和容错性的网络拓扑。
-