-
公开(公告)号:CN120046653A
公开(公告)日:2025-05-27
申请号:CN202411917060.X
申请日:2024-12-24
Applicant: 北京航天自动控制研究所
IPC: G06N3/0442 , G06N3/092
Abstract: 本发明公开了一种神经网络控制律高效自主学习方法。针对在运用深度强化学习算法实现复杂飞行器控制律自学习的过程中,超参数设定高度依赖于人工经验进而造成设计难度大,且不一定对于任务最优的问题,本发明引入图像识别领域网络架构搜索思想,提出基于神经网络架构轻量化搜索策略的飞行器控制律自学习方法。该方法在将神经网络架构设计问题转化为图拓扑生成问题的基础上,结合LSTM循环神经网络的图拓扑生成算法、基于权重共享的深度强化学习参数轻量化训练与评估机制,以及基于策略梯度的图拓扑生成器参数学习算法,实现了深度强化学习训练算法中神经网络架构超参数的自动优化,进而完成了控制律的自学习。