-
公开(公告)号:CN119024878A
公开(公告)日:2024-11-26
申请号:CN202410984216.X
申请日:2024-07-22
Applicant: 北京科技大学
IPC: G05D1/495 , G05D1/46 , G05D101/15 , G05D109/20
Abstract: 本发明涉及计算机技术领域,特别涉及一种鲁棒强化学习与对抗强化学习的无人机控制方法及装置。所述方法包括:初始化无人机系统,获取无人机的当前状态;基于当前状态,计算无人机的鲁棒部分控制量,基于鲁棒部分控制量判断是否需要触发强化学习控制输出准确控制量;将准确控制量输入至无人机系统,得到奖励;对强化学习控制器和对抗网络进行更新,并判断强化学习控制器和对抗网络是否收敛,保存网络参数,完成基于鲁棒强化学习与对抗强化学习的无人机控制。本发明既可以保证在训练前期施加较小的扰动保证强化学习控制模块网络可以收敛,也可以保证在训练后期施加尽可能大的干扰,以提高强化学习控制模块网络的抗扰能力。