基于深度强化学习的无人机路线规划方法及系统

    公开(公告)号:CN118896610A

    公开(公告)日:2024-11-05

    申请号:CN202410940842.9

    申请日:2024-07-15

    Abstract: 本发明提出基于深度强化学习的无人机路线规划方法,方法包括:利用基于梯度的柏林噪声和数字高程图构建三维非结构化地图;构建基于固定翼无人机的含约束的无人机自主探索的部分可观测马尔可夫决策过程模型对固定翼无人机的飞行路线进行约束;根据部分可观测马尔可夫决策过程模型构建基于深度学习的路线规划模型,并采用PPO算法对所述路线规划模型进行优化。本发明使用深度神经网络,拟合强化学习的动作价值函数、策略、模型等组成部分,构建从局部观测到值函数和策略函数的深度神经网络近似映射,建立部分可观测马尔可夫决策过程模型,完成强化学习框架搭建,提高模型在应对大规模状态空间时的鲁棒性与泛化能力。

Patent Agency Ranking