变体飞行器鲁棒深度强化学习制导控制一体化方法

    公开(公告)号:CN117518836B

    公开(公告)日:2024-04-09

    申请号:CN202410011463.1

    申请日:2024-01-04

    Applicant: 中南大学

    Abstract: 本发明实施例中提供了一种变体飞行器鲁棒深度强化学习制导控制一体化方法,属于控制技术领域,具体包括:建立飞行器纵向运动模型,并基于纵向运动模型和纵向航程控制建立制导方程,得到飞行器制导控制一体化模型及其对应的制导控制一体化问题描述;基于有限时间滑模控制理论和TD3算法框架,设计滑模控制算法与TD3算法联合的鲁棒深度强化学习方法,建立飞行器制导控制一体化问题的深度强化学习模型;基于鲁棒深度强化学习方法和深度强化学习模型,离线训练鲁棒制导控制智能体;将鲁棒制导控制智能体在线部署,使其在线输出控制指令,实现观测量到控制量的端到端飞行控制。通过本发明的方案,提高了控制效率、精准度、鲁棒性和自主性。

    基于深度强化学习的高超声速变外形飞行器姿态控制方法

    公开(公告)号:CN117289709B

    公开(公告)日:2024-06-28

    申请号:CN202311171003.7

    申请日:2023-09-12

    Applicant: 中南大学

    Abstract: 本公开实施例中提供了一种基于深度强化学习的高超声速变外形飞行器姿态控制方法,属于控制技术领域,具体包括:步骤1,建立飞行器的三自由度非线性再入姿态控制模型,化简模型并转化为状态空间模型;步骤2,根据状态空间模型设计飞行器的超螺旋控制器;步骤3,定义马尔可夫决策过程,将姿态控制问题转化为深度强化学习模型;步骤4,在传统TD3算法基础上,建立双经验回放池,并分别在执行网络和评价网络中引入LSTM网络架构,对该深度强化学习模型进行离线训练,利用训练好的决策模型进行参数的自适应调整。通过本公开的方案,提高了控制的稳定性、鲁棒性和精准度。

    变体飞行器鲁棒深度强化学习制导控制一体化方法

    公开(公告)号:CN117518836A

    公开(公告)日:2024-02-06

    申请号:CN202410011463.1

    申请日:2024-01-04

    Applicant: 中南大学

    Abstract: 本发明实施例中提供了一种变体飞行器鲁棒深度强化学习制导控制一体化方法,属于控制技术领域,具体包括:建立飞行器纵向运动模型,并基于纵向运动模型和纵向航程控制建立制导方程,得到飞行器制导控制一体化模型及其对应的制导控制一体化问题描述;基于有限时间滑模控制理论和TD3算法框架,设计滑模控制算法与TD3算法联合的鲁棒深度强化学习方法,建立飞行器制导控制一体化问题的深度强化学习模型;基于鲁棒深度强化学习方法和深度强化学习模型,离线训练鲁棒制导控制智能体;将鲁棒制导控制智能体在线部署,使其在线输出控制指令,实现观测量到控制量的端到端飞行控制。通过本发明的方案,提高了控制效率、精准度、鲁棒性和自主性。

    基于深度强化学习的高超声速变外形飞行器姿态控制方法

    公开(公告)号:CN117289709A

    公开(公告)日:2023-12-26

    申请号:CN202311171003.7

    申请日:2023-09-12

    Applicant: 中南大学

    Abstract: 本公开实施例中提供了一种基于深度强化学习的高超声速变外形飞行器姿态控制方法,属于控制技术领域,具体包括:步骤1,建立飞行器的三自由度非线性再入姿态控制模型,化简模型并转化为状态空间模型;步骤2,根据状态空间模型设计飞行器的超螺旋控制器;步骤3,定义马尔可夫决策过程,将姿态控制问题转化为深度强化学习模型;步骤4,在传统TD3算法基础上,建立双经验回放池,并分别在执行网络和评价网络中引入LSTM网络架构,对该深度强化学习模型进行离线训练,利用训练好的决策模型进行参数的自适应调整。通过本公开的方案,提高了控制的稳定性、鲁棒性和精准度。

Patent Agency Ranking