基于深度强化学习与时间约束的低空航空器冲突解脱方法

    公开(公告)号:CN119148745B

    公开(公告)日:2025-01-24

    申请号:CN202411621597.1

    申请日:2024-11-14

    Abstract: 本发明公开了一种基于深度强化学习与时间约束的低空航空器冲突解脱方法,属于航空安全技术领域,包括如下步骤:设置静态障碍物和非合作目标航空器,以构建低空运行环境;构建低空运行环境中航空器的状态空间和动作空间;构建带有时间约束的奖励函数;根据带有时间约束的奖励函数、低空运行环境中航空器的状态空间和动作空间,基于深度强化学习模型在低空运行环境中进行低空航空器冲突解脱训练,得到训练好深度强化学习模型;获取本体航空器在执行实际冲突解脱任务中的当前状态,并利用训练好的深度强化学习模型输出奖励值最高时对应的动作,以避免冲突的同时及时达到目标位置。本发明解决了低空航空器的冲突解脱能力和准点率不足的问题。

    基于深度强化学习与时间约束的低空航空器冲突解脱方法

    公开(公告)号:CN119148745A

    公开(公告)日:2024-12-17

    申请号:CN202411621597.1

    申请日:2024-11-14

    Abstract: 本发明公开了一种基于深度强化学习与时间约束的低空航空器冲突解脱方法,属于航空安全技术领域,包括如下步骤:设置静态障碍物和非合作目标航空器,以构建低空运行环境;构建低空运行环境中航空器的状态空间和动作空间;构建带有时间约束的奖励函数;根据带有时间约束的奖励函数、低空运行环境中航空器的状态空间和动作空间,基于深度强化学习模型在低空运行环境中进行低空航空器冲突解脱训练,得到训练好深度强化学习模型;获取本体航空器在执行实际冲突解脱任务中的当前状态,并利用训练好的深度强化学习模型输出奖励值最高时对应的动作,以避免冲突的同时及时达到目标位置。本发明解决了低空航空器的冲突解脱能力和准点率不足的问题。

Patent Agency Ranking