基于通道注意力机制深度强化学习算法的多无人艇协同围捕方法

    公开(公告)号:CN119168601B

    公开(公告)日:2025-03-25

    申请号:CN202411666628.5

    申请日:2024-11-21

    Abstract: 本发明公开了一种基于通道注意力机制深度强化学习算法的多无人艇协同围捕方法,包括以下步骤:建立海上无人艇围捕博弈环境,确定围捕艇的动力学模型以及观测空间,逃逸艇的逃逸策略定义围捕成功的条件;基于通道注意力网络将无人艇对友方的观测空间维数固定;构建多智能体深度确定性策略梯度算法框架,结合围捕问题设计距离协作和角度协作的奖励函数;采用集中训练,分布执行的训练框架生成多无人艇协同围捕策略。本发明得到的协同围捕策略考虑了不同围捕艇的数量影响,能够适应未来不确定数量的围捕环境变化,同时合理的单体协同奖励函数设计能够提高围捕任务的成功率。

    基于通道注意力机制深度强化学习算法的多无人艇协同围捕方法

    公开(公告)号:CN119168601A

    公开(公告)日:2024-12-20

    申请号:CN202411666628.5

    申请日:2024-11-21

    Abstract: 本发明公开了一种基于通道注意力机制深度强化学习算法的多无人艇协同围捕方法,包括以下步骤:建立海上无人艇围捕博弈环境,确定围捕艇的动力学模型以及观测空间,逃逸艇的逃逸策略定义围捕成功的条件;基于通道注意力网络将无人艇对友方的观测空间维数固定;构建多智能体深度确定性策略梯度算法框架,结合围捕问题设计距离协作和角度协作的奖励函数;采用集中训练,分布执行的训练框架生成多无人艇协同围捕策略。本发明得到的协同围捕策略考虑了不同围捕艇的数量影响,能够适应未来不确定数量的围捕环境变化,同时合理的单体协同奖励函数设计能够提高围捕任务的成功率。

Patent Agency Ranking