基于MPC-NDQN的无人机着艇方法、设备、介质
摘要:
本发明涉及一种基于MPC‑NDQN的无人机着艇方法、设备、介质,方法包括如下步骤:通过构建无人机动力学模型,得到基于输入控制量和状态变量的离散化的线性状态空间方程,通过MPC得到未来一段时间内的着艇轨迹;基于着艇轨迹,利用NDQN更新噪声网络的网络参数;基于更新后的噪声网络得到最优动作,实现无人机飞行姿态的控制,NDQN中,以无人机的位姿和降落点的坐标作为状态空间,以无人机的飞行姿态作为动作空间,以着艇轨迹跟踪率作为奖励函数,且采用计及新老信息置信度和远见程度的价值函数。NDQN网络中带有标准正态分布的噪声,能在训练时产生一定的随机性,因此无人机即使在不确定的环境下也能精准跟踪最优着艇轨迹。
0/0