-
公开(公告)号:CN119065398A
公开(公告)日:2024-12-03
申请号:CN202411084350.0
申请日:2024-08-08
Applicant: 同济大学
Abstract: 本发明涉及一种分布式无人机协同防御意图协调方法及训练方法,包括:将多无人机协同防御问题建模为分布式马尔可夫过程,使用深度强化学习训练底层一对一策略,作为本发明关注的目标分配器的底层策略;采用基于自注意力机制的、结合冲突消解机制的神经网络作为集中式目标分配器,用强化学习训练得到具备冲突消解能力的集中式策略;构建基于注意力机制的可扩展分布式意图融合;基于集中式策略生成的数据,采用模仿学习训练分布式目标分配。与现有技术相比,本发明具有解决了无人机数量的可扩展性问题,从而具备更好的泛化性能,显著提高在分布式情形下的目标分配冲突消解能力,进而提高整体性能等优点。
-
公开(公告)号:CN115291625A
公开(公告)日:2022-11-04
申请号:CN202210831674.0
申请日:2022-07-15
Applicant: 同济大学
IPC: G05D1/10
Abstract: 本申请提供了一种基于多智能体分层强化学习的多无人机空战决策方法,所述方法包括:基于实际多无人机空战场景构建的仿真环境,包括环境约束模型、无人机个体约束模型和对抗影响规则;将多无人机空战问题建模为半马尔可夫博弈模型,单个无人机的决策过程抽象为代表高层和底层策略的两个智能体,分别定义各智能体的状态空间表示、动作、奖励函数和动作终止条件;采用一种异策略同步学习与自博弈机制结合的多智能体强化学习算法分别训练无人机高层和底层策略智能体;完成训练后无人机基于底层策略智能体的策略网络和局部观测进行决策;该方法可实现空战环境下多无人机的自主无人协同决策,无需人类驾驶员介入,具有较好的即时性和鲁棒性。
-