一种航天器深度强化学习莱维飞行控制系统

    公开(公告)号:CN113419548A

    公开(公告)日:2021-09-21

    申请号:CN202110593261.9

    申请日:2021-05-28

    Abstract: 一种航天器深度强化学习莱维飞行控制系统,包括:自主规划模块,根据航天器的状态信息获取特征,利用该特征进行预测,并获得莱维飞行参数;莱维飞行模块,利用莱维飞行参数,确定下一时刻的飞行轨迹;航天器姿轨控模块,用于控制飞行器跟踪下一时刻的飞行轨迹。本发明在莱维飞行的基础上,采用深度强化学习以综合考虑各种因素,选择最佳的飞行轨迹,以保证在最优的飞行性能。

    一种多智能体分布式强化学习方法

    公开(公告)号:CN113269329A

    公开(公告)日:2021-08-17

    申请号:CN202110484030.4

    申请日:2021-04-30

    Abstract: 一种多智能体分布式强化学习方法,包括多智能体组织形式、智能体网络设计和训练方法。通过强化学习的方式实现整个网络系统的自适应网络服务,解决网络的分布式自主覆盖、目标追踪、缺位补充等高层次协同操作背后的关键技术,提升整个系统的综合感知保障能力和自愈合能力,使得整个系统具备极强的自组织、自配置和自管理能力,具备自我防护、系统修复和重构能力,以应对外部环境的变化。

    一种航天器能力建模方法和系统

    公开(公告)号:CN113158343A

    公开(公告)日:2021-07-23

    申请号:CN202110432079.5

    申请日:2021-04-21

    Abstract: 本发明公开了一种航天器能力建模方法和系统,该方法包括:根据任务要求,对具有相同技术要求的指标进行归纳,得到多个类型的能力指标,并确定各能力指标的指标值;其中,多个类型的能力指标,包括:以航天器性能参数为特征的Np个性能指标,以航天器功能模式为特征的Nf个功能指标和以航天器智能化水平为特征的Ni个智能指标;对携带有指标值的各类型的能力指标进行面向场景的指标筛选,得到确定场景下的航天器能力指标集合;根据确定场景下的航天器能力指标集合,进行面向任务进行能力指标重组,生成任务能力指标,得到面向任务的航天器能力模型。本发明旨在解决传统的能力指标归纳方法存在的问题,实现航天器面向动态场景的能力分析与评估。

    一种基于深度强化学习的足式机器人运动控制方法及系统

    公开(公告)号:CN109483530B

    公开(公告)日:2020-11-20

    申请号:CN201811216658.0

    申请日:2018-10-18

    Abstract: 本发明公开了一种基于深度强化学习的足式机器人运动控制方法及系统,其中,该方法包括:构建足式机器人3D模型;设计奖惩函数;构建动作网络和目标动作网络,并完成网络初始化;用动作网络生成控制量,得到下一时刻机器人的状态,计算奖惩值;随机选取一定数量的样本,计算目标评价网络的状态‑动作值,并根据Bellman方程更新评价网络的输出;利用评价网络对动作网络的权值进行更新;利用评价网络和动作网络权值更新目标评价网络和目标动作网络;重复上述步骤,直至网络收敛;根据动作网络,得到机器人运动的控制指令。本发明使得足式机器人实现在未知环境下的高效平稳移动。

    一种高超声速飞行器再入末段姿态控制方法及系统

    公开(公告)号:CN110162071A

    公开(公告)日:2019-08-23

    申请号:CN201910441100.0

    申请日:2019-05-24

    Abstract: 一种高超声速飞行器再入末段姿态控制方法及系统,包括:(1)选取姿态跟踪误差作为被控输出,结合控制目标及飞行器姿态动力学分析,建立三通道姿态误差特征模型;(2)通过特征模型参数的时变结构特性分析,将动压引入参数自适应更新律中,建立基于动压的参数估计模型;(3)设计自适应输出反馈控制结构,并结合期望的系统动态,确定控制器反馈系数。本发明具有对大范围快时变环境的适应性强、控制精度较高且控制器结构简单等优点,适用于高超声速飞行器高速高机动再入时姿态高精度稳定控制。

    动态逆控制中基于加计信息解算慢回路控制指令的方法及系统

    公开(公告)号:CN109062047A

    公开(公告)日:2018-12-21

    申请号:CN201810940326.0

    申请日:2018-08-17

    CPC classification number: G05B13/042

    Abstract: 本发明的动态逆控制中基于加计信息解算慢回路控制指令的方法及系统,获取飞行器导航系统输出的导航信息,三轴加计输出的测量信息,以及制导系统输出的期望姿态控制指令;对三轴加计输出的测量信息进行滤波处理;根据导航信息和滤波后的三轴加计测量信息,建立慢回路逆模型;根据飞行器的导航系统输出的导航信息和制导系统输出的期望姿态控制指令,生成伪控制指令;最后生成慢回路控制指令,避免了慢回路复杂逆模型的解算及误差的在线补偿,同时可以抵抗除导航系统误差(含重力计算误差)以外的干扰,实现了低耗时、高精度的慢回路控制律解算。

    一种基于深度自编码网络的非线性控制分配方法

    公开(公告)号:CN107515530A

    公开(公告)日:2017-12-26

    申请号:CN201710566663.3

    申请日:2017-07-12

    CPC classification number: G05B13/027 G05B13/042

    Abstract: 一种基于深度自编码网络的非线性控制分配方法,包括:(1)构建和训练多层前馈神经网络,实现舵偏到力矩的非线性映射函数的拟合;(2)构建自编码神经网络;(3)对所述自编码神经网络中的编码器进行无监督训练,得到力矩到舵偏的非线性模型;(4)将步骤(3)得到的所述非线性模型嵌入到姿态控制系统回路中,以期望控制力矩作为非线性模型的输入,实时地计算出非线性模型的输出,即得到舵偏的期望值,从而实现非线性控制分配。

Patent Agency Ranking