Patent search ap:("同济大学") AND inv:"丁怡" Page 1

1.

发明授权
一种基于策略梯度的无人机多目标最优控制方法和设备有权

公开(公告)号：CN114384931B

公开(公告)日：2023-08-29

申请号：CN202111590154.7

申请日：2021-12-23

Applicant: 同济大学

Inventor： 张皓 , 丁怡 , 王祝萍 , 张长柱 , 黄超

IPC: G05D1/10

Abstract: 本发明涉及一种基于策略梯度的无人机多目标最优控制方法，具体包括以下步骤：S1、获取无人机在目标飞行区间中离散时间非线性系统的多个性能指标，构建相应的状态‑动作价值函数；S2、获取一个在容许控制集内的初始控制策略；S3、根据多个状态‑动作价值函数和当前的控制策略进行策略评估，得到策略评估结果；S4、根据步骤S3的策略评估结果，结合梯度下降的方法进行策略改进，得到优化控制策略，判断优化控制策略是否满足预设的收敛条件，若否返回步骤S3，若是则将相应的优化控制策略作为最终的无人机控制策略。与现有技术相比，本发明具有使无人机消耗的能量更小，任务完成度更高，提升整体运行效率等优点。

2.

发明公开
一种基于策略梯度的无人机多目标最优控制方法和设备有权

公开(公告)号：CN114384931A

公开(公告)日：2022-04-22

申请号：CN202111590154.7

申请日：2021-12-23

Applicant: 同济大学

Inventor： 张皓 , 丁怡 , 王祝萍 , 张长柱 , 黄超

IPC: G05D1/10

Abstract: 本发明涉及一种基于策略梯度的无人机多目标最优控制方法，具体包括以下步骤：S1、获取无人机在目标飞行区间中离散时间非线性系统的多个性能指标，构建相应的状态‑动作价值函数；S2、获取一个在容许控制集内的初始控制策略；S3、根据多个状态‑动作价值函数和当前的控制策略进行策略评估，得到策略评估结果；S4、根据步骤S3的策略评估结果，结合梯度下降的方法进行策略改进，得到优化控制策略，判断优化控制策略是否满足预设的收敛条件，若否返回步骤S3，若是则将相应的优化控制策略作为最终的无人机控制策略。与现有技术相比，本发明具有使无人机消耗的能量更小，任务完成度更高，提升整体运行效率等优点。

Patent Agency Ranking