一种基于策略梯度的无人机多目标最优控制方法和设备

    公开(公告)号:CN114384931B

    公开(公告)日:2023-08-29

    申请号:CN202111590154.7

    申请日:2021-12-23

    Applicant: 同济大学

    Abstract: 本发明涉及一种基于策略梯度的无人机多目标最优控制方法,具体包括以下步骤:S1、获取无人机在目标飞行区间中离散时间非线性系统的多个性能指标,构建相应的状态‑动作价值函数;S2、获取一个在容许控制集内的初始控制策略;S3、根据多个状态‑动作价值函数和当前的控制策略进行策略评估,得到策略评估结果;S4、根据步骤S3的策略评估结果,结合梯度下降的方法进行策略改进,得到优化控制策略,判断优化控制策略是否满足预设的收敛条件,若否返回步骤S3,若是则将相应的优化控制策略作为最终的无人机控制策略。与现有技术相比,本发明具有使无人机消耗的能量更小,任务完成度更高,提升整体运行效率等优点。

    一种基于策略梯度的无人机多目标最优控制方法和设备

    公开(公告)号:CN114384931A

    公开(公告)日:2022-04-22

    申请号:CN202111590154.7

    申请日:2021-12-23

    Applicant: 同济大学

    Abstract: 本发明涉及一种基于策略梯度的无人机多目标最优控制方法,具体包括以下步骤:S1、获取无人机在目标飞行区间中离散时间非线性系统的多个性能指标,构建相应的状态‑动作价值函数;S2、获取一个在容许控制集内的初始控制策略;S3、根据多个状态‑动作价值函数和当前的控制策略进行策略评估,得到策略评估结果;S4、根据步骤S3的策略评估结果,结合梯度下降的方法进行策略改进,得到优化控制策略,判断优化控制策略是否满足预设的收敛条件,若否返回步骤S3,若是则将相应的优化控制策略作为最终的无人机控制策略。与现有技术相比,本发明具有使无人机消耗的能量更小,任务完成度更高,提升整体运行效率等优点。

Patent Agency Ranking