一种渐进式深度强化学习的无人载具对抗与避障方法

    公开(公告)号:CN116243727A

    公开(公告)日:2023-06-09

    申请号:CN202310260597.2

    申请日:2023-03-17

    Applicant: 厦门大学

    Abstract: 本发明涉及一种渐进式深度强化学习的无人载具对抗与避障方法,包括以下步骤:S1,根据无人载具的运动学模型,通过龙格库塔方法进行求解建模;S2,通过计算机模拟多台无人载具系统的自主决策过程;S3,设计并优化渐进式自博弈SAC算法的批判者神经网络和执行者神经网络的形式、大小和数量,针对无人载具的真实运动情况构建执行者神经网络、策略熵系数α的目标损失函数,并结合熵增机制和训练课程难度,设计自动熵,得到渐进式自博弈SAC算法;S4,利用所述渐进式自博弈SAC算法自调节所述训练课程难度并执行自博弈过程,完成一次学习课程;S5,重复执行步骤S4,得到完成训练的执行者神经网络用于生成无人载具对抗与避障的实时决策。

Patent Agency Ranking