-
公开(公告)号:CN117993474A
公开(公告)日:2024-05-07
申请号:CN202410292368.3
申请日:2024-03-14
Applicant: 南京大学
Abstract: 本发明公开一种基于深度学习的无人机虚实结合强化学习环境增强方法,包括:预训练模型导出强化学习的决策单元。虚实结合时空环境增强,使用预训练的决策单元进行若干轮真机飞行的验证;通过平均时延曲线导出用作无人机虚拟环境中单步决策的时间间隔的补偿值,进行时间上的环境增强;利用误差模型进行空间上的环境增强。增强环境再训练,使用时空增强的环境再次对无人机导航进行训练,进行真机飞行,并比对虚拟轨迹和真实轨迹的差异。该方法充分利用了虚实结合环境增强方法,具有设计简单、鲁棒性较佳以及构建出的强化学习环境具有仿真度高的优点,其训练出来的策略具有泛化能力强、适应性强等特点,能直接应用在真实无人机编队、导航等任务上。