基于深度强化学习的无人机集群侦查对抗方法及装置

    公开(公告)号:CN117707219B

    公开(公告)日:2024-05-17

    申请号:CN202410162415.2

    申请日:2024-02-05

    IPC分类号: G05D1/695 G05D109/20

    摘要: 本申请公开了一种基于深度强化学习的无人机集群侦查对抗方法及装置,该方法包括:构建对抗空间;基于改进的深度强化学习算法构建对抗网络模型,设置经验缓存区;为无人机设置自身状态与执行动作,设置无人机集群的全局奖励函数;获取无人机集群的当前观测值,确定各无人机的执行动作构成无人机集群的联合动作;在三维对抗环境中执行联合动作,得到全局奖励值与下一时刻的观测值,将对抗经验存入经验缓存区;随机采样一组对抗经验作为样本训练对抗网络模型,评估训练后的对抗网络模型的性能。解决了现有技术在无人机集群侦察对抗环境中使用DQN存在局限性的问题,进而实现了一种仿真对抗效果更好的无人机集群侦查对抗方法,更具备实际参考价值。

    基于深度强化学习的无人机集群侦查对抗方法及装置

    公开(公告)号:CN117707219A

    公开(公告)日:2024-03-15

    申请号:CN202410162415.2

    申请日:2024-02-05

    IPC分类号: G05D1/695 G05D109/20

    摘要: 本申请公开了一种基于深度强化学习的无人机集群侦查对抗方法及装置,该方法包括:构建对抗空间;基于改进的深度强化学习算法构建对抗网络模型,设置经验缓存区;为无人机设置自身状态与执行动作,设置无人机集群的全局奖励函数;获取无人机集群的当前观测值,确定各无人机的执行动作构成无人机集群的联合动作;在三维对抗环境中执行联合动作,得到全局奖励值与下一时刻的观测值,将对抗经验存入经验缓存区;随机采样一组对抗经验作为样本训练对抗网络模型,评估训练后的对抗网络模型的性能。解决了现有技术在无人机集群侦察对抗环境中使用DQN存在局限性的问题,进而实现了一种仿真对抗效果更好的无人机集群侦查对抗方法,更具备实际参考价值。