一种基于DDPG强化学习火箭回收控制器实现与仿真的应用方法

    公开(公告)号:CN118550207A

    公开(公告)日:2024-08-27

    申请号:CN202311634804.2

    申请日:2023-12-01

    Abstract: 本申请实施例中提供了一种基于DDPG强化学习的火箭回收控制器实现与仿真的应用方法,涉及飞行器制导控制技术领域,该方法包括以下步骤:对火箭下落过程进行了简化动力学建模并进行reward设计,采用改进后输出均值和标准差的DDPG进行训练;对火箭下落轨迹采用强化学习的方式进行轨迹规划和制导;其中,该方法的主要内容包括:定义描述轨迹的状态量并根据终端约束设计相应的回报函数、采用DDPG进行连续行为的轨迹规划和制导、并引入Mindspore国产化框架进行仿真。本申请,通过网络结构的改进和奖励函数的设计取得了较好效果,并可以基于数学仿真实现火箭垂直返回软着陆。

    一种控制系统控制组合类产品的从模块测试时间计算方法

    公开(公告)号:CN115933812A

    公开(公告)日:2023-04-07

    申请号:CN202211604668.8

    申请日:2022-12-13

    Abstract: 本公开的控制系统控制组合类产品的从模块测试时间计算方法,通过从模块接收主模块发送的PWM时钟同步信号,对PWM时钟同步信号进行计数得到计数值CNT;从模块在PWM时钟同步信号的周期内生成时间戳信号,得到时间戳信号计数值M;记录主模块获取从模块测试信息的本地时间Tlocal_cur,根据本地时间Tlocal_cur、PWM时钟同步信号的周期T1、计数值CNT、时间戳信号M和时间戳信号的周期T2对计数值CNT翻转后的测试时间进行补偿得到翻转补偿的测试时间Tcom_seq;根据测试时间Tcom_seq、系统同步本地时间Tsystem_syn、主模块本地时间Tlocal_syn、主模块和从模块同步加电的初始偏差Δt计算从模块测试时间Tseq_output。通过主模块对PWM时钟同步信号的翻转次数进行补偿,使得最终生成的测试计时与系统保持一致,提升控制组合产品的测试性能。

    一种飞行姿态控制方法
    15.
    发明公开

    公开(公告)号:CN114200950A

    公开(公告)日:2022-03-18

    申请号:CN202111248696.6

    申请日:2021-10-26

    Abstract: 本发明公开了飞行姿态控制方法,属于机器学习技术领域,方法包括:构建飞行姿态控制律的学习所需的探索环境;根据所述探索环境输出的姿态角、姿态角速度,以及期望姿态角指令,构建所述飞行姿态控制律的学习所需的输入信号;将从所述飞行姿态控制律得到的舵机理论输出指令输入至舵机限幅单元,获取所述舵机限幅单元的输出结果,并将所述输出结果输入至所述探索环境;构建奖励回报单元,所述奖励回报单元反馈所述探索环境的姿态角的当前时刻奖励至所述飞行姿态控制律,并通过最大化总奖励优化所述飞行姿态控制律的学习;对所述飞行姿态控制律进行学习,获取最终的飞行姿态控制律,基于所述飞行姿态控制律对飞行姿态进行控制。

Patent Agency Ranking