-
公开(公告)号:CN113741533B
公开(公告)日:2025-01-24
申请号:CN202111089240.X
申请日:2021-09-16
Applicant: 中国电子科技集团公司第五十四研究所
IPC: G05D1/46 , G05D109/20
Abstract: 本发明公开了一种基于模仿学习与强化学习的无人机智能决策系统,包括环境感知模块、专家行为演示模块、决策学习模块以及控制执行模块,该系统可以对复杂的实时场景做出准确的决策,达到从起始点飞行到设定终止点的目标,能够在整个飞行过程中自主决策,根据环境信息、实时事件等选择无人机控制策略,规避障碍物,安全高效到达目标点。相较传统设计专家规则的决策系统,本发明由模仿学习对专家行为进行行为克隆,得到决策控制网络的初始值,再由深度强化学习,依据执行飞行任务过程中的事件、状态设置奖励函数,学习得到更加准确、泛化性更好的决策控制Q网络,对于提升无人机自主控制性能具有重要作用。
-
公开(公告)号:CN113741533A
公开(公告)日:2021-12-03
申请号:CN202111089240.X
申请日:2021-09-16
Applicant: 中国电子科技集团公司第五十四研究所
IPC: G05D1/10
Abstract: 本发明公开了一种基于模仿学习与强化学习的无人机智能决策系统,包括环境感知模块、专家行为演示模块、决策学习模块以及控制执行模块,该系统可以对复杂的实时场景做出准确的决策,达到从起始点飞行到设定终止点的目标,能够在整个飞行过程中自主决策,根据环境信息、实时事件等选择无人机控制策略,规避障碍物,安全高效到达目标点。相较传统设计专家规则的决策系统,本发明由模仿学习对专家行为进行行为克隆,得到决策控制网络的初始值,再由深度强化学习,依据执行飞行任务过程中的事件、状态设置奖励函数,学习得到更加准确、泛化性更好的决策控制Q网络,对于提升无人机自主控制性能具有重要作用。
-