一种拦截随机机动目标航天器的深度强化学习制导律

    公开(公告)号:CN117755521B

    公开(公告)日:2024-09-20

    申请号:CN202310405974.7

    申请日:2023-04-17

    Abstract: 本发明提供一种拦截随机机动目标航天器的深度强化学习制导律。本发明设计了在目标可以进行随机机动规避拦截的场景下,一对一的深度强化学习训练环境,并设计相关奖惩训练机制,探究在随机性环境中在拦截卫星决策上的可行性与应用效果。用来拦截传统方法难以解决的目标卫星随机机动的任务。

    一种基于比例变换的连续力矩航天器姿态跟踪控制方法

    公开(公告)号:CN115509245A

    公开(公告)日:2022-12-23

    申请号:CN202211159466.7

    申请日:2022-09-22

    Abstract: 一种基于比例变换的连续力矩航天器姿态跟踪控制方法,本发明涉及基于比例变换的连续力矩航天器姿态跟踪控制方法。本发明的目的是为了解决现有针对预设时间预设精度的姿态跟踪控制算法给出的控制力矩并不连续,导致无法控制航天器姿态在任务期望的时间之前达到任务期望的精度范围的问题。一种基于比例变换的连续力矩航天器姿态跟踪控制方法过程为:步骤一:构建航天器的姿态运动模型;航天器的姿态运动模型由航天器的姿态运动学方程和姿态动力学方程构成;将航天器的姿态运动模型表示为姿态误差四元数;步骤二:选取控制变量;步骤三:基于步骤一和步骤二获得控制器输出的控制力矩。本发明属于航天器姿态控制技术领域。

    可在轨实现掠飞观测任务的变轨方法、装置及介质

    公开(公告)号:CN115610704B

    公开(公告)日:2023-09-29

    申请号:CN202211185563.3

    申请日:2022-09-27

    Abstract: 本发明实施例公开了一种可在轨实现掠飞观测任务的变轨方法、装置及介质,属于航天器导航制导与控制技术领域;该方法包括:设定计算目标函数值的方法;根据待优化变量中的相互独立变量,在设定的变量取值区域内进行大步长遍历,获得多个数据点;针对每个数据点分别求解兰伯特问题,得到每个数据点对应的目标函数值;在所有数据点对应的目标函数值中筛选获得符合设定观测约束条件的目标函数值;将符合设定观测约束条件的目标函数值中的最小值选取为迭代初值;根据迭代初值基于序列二次规划算法进行迭代优化,获得最终的近似全局最优解。

    可在轨实现掠飞观测任务的变轨方法、装置及介质

    公开(公告)号:CN115610704A

    公开(公告)日:2023-01-17

    申请号:CN202211185563.3

    申请日:2022-09-27

    Abstract: 本发明实施例公开了一种可在轨实现掠飞观测任务的变轨方法、装置及介质,属于航天器导航制导与控制技术领域;该方法包括:设定计算目标函数值的方法;根据待优化变量中的相互独立变量,在设定的变量取值区域内进行大步长遍历,获得多个数据点;针对每个数据点分别求解兰伯特问题,得到每个数据点对应的目标函数值;在所有数据点对应的目标函数值中筛选获得符合设定观测约束条件的目标函数值;将符合设定观测约束条件的目标函数值中的最小值选取为迭代初值;根据迭代初值基于序列二次规划算法进行迭代优化,获得最终的近似全局最优解。

    一种拦截随机机动目标航天器的深度强化学习制导律

    公开(公告)号:CN117755521A

    公开(公告)日:2024-03-26

    申请号:CN202310405974.7

    申请日:2023-04-17

    Abstract: 本发明提供一种拦截随机机动目标航天器的深度强化学习制导律。本发明设计了在目标可以进行随机机动规避拦截的场景下,一对一的深度强化学习训练环境,并设计相关奖惩训练机制,探究在随机性环境中在拦截卫星决策上的可行性与应用效果。用来拦截传统方法难以解决的目标卫星随机机动的任务。

    一种基于蒙特卡洛树搜索的航天器序列博弈方法、装置及介质

    公开(公告)号:CN116039956B

    公开(公告)日:2023-11-14

    申请号:CN202211364933.X

    申请日:2022-11-02

    Abstract: 本发明实施例公开了一种基于蒙特卡洛树搜索的航天器序列博弈方法,属于航天器轨道控制技术领域;该方法包括:在当前回合,构建当前回合的初始状态信息s0;以当前回合的初始状态信息为博弈树的根节点,从在离散动作空间展开形成的候选状态中选择一个或多个构建所述博弈树的待探索子树;根据所述待探索子树中所展开的所有叶节点的每一个的状态评估信息,通过回溯传播更新由所述根节点到所述叶节点之间路径上的所有节点的效用估计信息;根据所述博弈树更新后的效用估计信息,做出当前回合的最优动作决策;根据所述最优动作决策控制决策航天器自身的运动状态,以使得对手航天器基于决策航天器控制后的运动状态进行动作决策。

    一种基于比例变换的连续力矩航天器姿态跟踪控制方法

    公开(公告)号:CN115509245B

    公开(公告)日:2024-08-27

    申请号:CN202211159466.7

    申请日:2022-09-22

    Abstract: 一种基于比例变换的连续力矩航天器姿态跟踪控制方法,本发明涉及基于比例变换的连续力矩航天器姿态跟踪控制方法。本发明的目的是为了解决现有针对预设时间预设精度的姿态跟踪控制算法给出的控制力矩并不连续,导致无法控制航天器姿态在任务期望的时间之前达到任务期望的精度范围的问题。一种基于比例变换的连续力矩航天器姿态跟踪控制方法过程为:步骤一:构建航天器的姿态运动模型;航天器的姿态运动模型由航天器的姿态运动学方程和姿态动力学方程构成;将航天器的姿态运动模型表示为姿态误差四元数;步骤二:选取控制变量;步骤三:基于步骤一和步骤二获得控制器输出的控制力矩。本发明属于航天器姿态控制技术领域。

    一种基于蒙特卡洛树搜索的航天器序列博弈方法、装置及介质

    公开(公告)号:CN116039956A

    公开(公告)日:2023-05-02

    申请号:CN202211364933.X

    申请日:2022-11-02

    Abstract: 本发明实施例公开了一种基于蒙特卡洛树搜索的航天器序列博弈方法,属于航天器轨道控制技术领域;该方法包括:在当前回合,构建当前回合的初始状态信息s0;以当前回合的初始状态信息为博弈树的根节点,从在离散动作空间展开形成的候选状态中选择一个或多个构建所述博弈树的待探索子树;根据所述待探索子树中所展开的所有叶节点的每一个的状态评估信息,通过回溯传播更新由所述根节点到所述叶节点之间路径上的所有节点的效用估计信息;根据所述博弈树更新后的效用估计信息,做出当前回合的最优动作决策;根据所述最优动作决策控制决策航天器自身的运动状态,以使得对手航天器基于决策航天器控制后的运动状态进行动作决策。

Patent Agency Ranking