具有实时性的深度强化学习方法

    公开(公告)号:CN119005288B

    公开(公告)日:2025-05-06

    申请号:CN202411024024.0

    申请日:2024-07-29

    Abstract: 本发明公开了一种具有实时性的深度强化学习方法,所述方法包括如下步骤:步骤1、估计决策动作的均值:Agent从任意给定的初始估计状态开始,利用宽度学习系统从最新的数据中学习状态的增量;步骤2、选择决策动作:在以宽度学习系统的输出向量为均值,以双Q网络的输出值中的较小值为协方差的高斯分布策略上选择决策动作;步骤3、更新状态。本发明鉴于宽度学习系统能够快速训练并具有良好的泛化能力,宽度学习系统通过扩展网络的宽度而非深度,实现了对信息的快速处理与学习,通过线性方程直接求解输出权重,从而提高了深度强化学习方法的实时性。

    具有实时性的深度强化学习方法

    公开(公告)号:CN119005288A

    公开(公告)日:2024-11-22

    申请号:CN202411024024.0

    申请日:2024-07-29

    Abstract: 本发明公开了一种具有实时性的深度强化学习方法,所述方法包括如下步骤:步骤1、估计决策动作的均值:Agent从任意给定的初始估计状态开始,利用宽度学习系统从最新的数据中学习状态的增量;步骤2、选择决策动作:在以宽度学习系统的输出向量为均值,以双Q网络的输出值中的较小值为协方差的高斯分布策略上选择决策动作;步骤3、更新状态。本发明鉴于宽度学习系统能够快速训练并具有良好的泛化能力,宽度学习系统通过扩展网络的宽度而非深度,实现了对信息的快速处理与学习,通过线性方程直接求解输出权重,从而提高了深度强化学习方法的实时性。

    一种考虑输入饱和的航天器姿态可变性能控制方法

    公开(公告)号:CN118457945B

    公开(公告)日:2024-11-05

    申请号:CN202410506975.5

    申请日:2024-04-25

    Abstract: 一种考虑输入饱和的航天器姿态可变性能控制方法,涉及航天器姿态控制技术领域。考虑存在外部环境干扰和输入饱和的航天器姿态控制系统建立航天器动力学模型,采用误差转换函数将航天器姿态控制系统变换为预设性能的航天器姿态模型;结合饱和限幅函数构造可变性能函数方程;结合预设性能的航天器姿态模型和可变性能函数设计控制输入,从而设计抗饱和辅助系统。基于预设性能控制,考虑外部环境干扰以及输入饱和限幅,通过引入可变性能函数,解决航天器姿态预设性能控制在饱和时的失效问题。

    基于预设性能的机械臂轨迹跟踪控制方法

    公开(公告)号:CN116901061B

    公开(公告)日:2024-07-09

    申请号:CN202310719125.9

    申请日:2023-06-16

    Abstract: 基于预设性能的机械臂轨迹跟踪控制方法,属于非线性系统控制领域。本发明针对机械臂的轨迹跟踪问题设计了一种基于指定时间预设性能函数的控制器,其控制对象为一考虑未知系统动力学和外界干扰的刚性机械臂,采用预设性能控制和转换误差的方法设计控制律,实现指定时间轨迹跟踪控制,其收敛时间可直接给定,收敛精度精确可控,系统的瞬态性能也可提前规定。同时引入径向基函数神经网络,根据系统的状态量估计机械臂的未知系统动力学,使得系统能够有效的克服未知系统动力学和外界干扰,不需要知道外界扰动的上界具体值,有利于机械臂系统在不同的老化程度下和不同环境下正常工作。

    一种刚体航天器的抗退绕滑模姿态机动控制方法及系统

    公开(公告)号:CN111874266B

    公开(公告)日:2022-03-01

    申请号:CN202010229161.3

    申请日:2020-03-27

    Abstract: 本发明提供了一种刚体航天器的抗退绕滑模姿态机动控制方法及系统,该抗退绕滑模姿态机动控制方法包括:步骤S1:建立刚体航天器姿态误差的运动学方程和动力学方程;步骤S2:构造滑模函数,使得滑模面包含两个平衡点;步骤S3:基于李雅普诺夫理论,设计抗退绕滑模姿态机动控制算法;步骤S4:将抗退绕滑模姿态机动控制算法应用于刚体航天器,避免航天器发生退绕的情况。本发明的有益效果是:本发明通过抗退绕滑模姿态机动控制方法可以使航天器系统具有良好的稳定性,当航天器系统受到外部干扰进行姿态机动时,航天器的姿态能很快趋于稳定,无退绕现象。

    对称迟后-超前校正的一体化频率设计方法

    公开(公告)号:CN111832115A

    公开(公告)日:2020-10-27

    申请号:CN202010489269.6

    申请日:2020-06-02

    Abstract: 本发明公开了对称迟后-超前校正的一体化频率设计方法,该方法包括(S1)根据所要求的稳态性能指标确定系统的开环增益;(S2)利用已知的开环增益,绘制未校正系统G0(s)的Bode图,并计算未校正系统的剪切频率ωc0,相角裕度γ0和增益裕度Lg0;(S3)根据相角裕度的要求确定超前-迟后校正环节的α,为使相角裕度r0达到要求值,计算超前环节所需提供的超前相角 (S4)确定校正后系统的剪切频率ωc;(S5)确定超前校正环节;(S6)确定迟后校正环节;(S7)检验是否满足系统的性能指标,若不满足要求,可增大附加相角Δ的值,从步骤(S3)重新计算。通过上述方案,本发明达到了一次性处理迟后与超前的目的,具有很高的实用价值和推广价值。

    一种低复杂度的航天器抗退绕预设性能姿态跟踪控制方法

    公开(公告)号:CN119336066B

    公开(公告)日:2025-04-29

    申请号:CN202411453187.0

    申请日:2024-10-17

    Abstract: 本发明公开了一种低复杂度的航天器抗退绕预设性能姿态跟踪控制方法,所述方法如下:建立基于特殊正交矩阵群的姿态跟踪模型;利用指定时间性能函数设计能够抑制超调量的性能边界,将保证姿态跟踪误差收敛进性能边界内的问题转化为保证姿态跟踪误差函数收敛进预设性能边界内的问题;设计姿态跟踪误差函数的转换误差,将原有的姿态误差函数约束问题转化为转换误差有界的问题,根据反步法,设计虚拟输入保证转换误差的有界性;对角速度跟踪误差和虚拟输入之间的误差设计设置性能边界,将该误差的约束问题转化为转换误差的有界性问题,设计控制器保证转换误差有界,保证角速度跟踪误差的有界性,完成控制目标。本发明具有结构简单和节省能耗的优点。

    基于全驱系统理论的挠性航天器姿态控制方法

    公开(公告)号:CN117963168A

    公开(公告)日:2024-05-03

    申请号:CN202311539162.8

    申请日:2023-11-17

    Inventor: 李志 张颖 吴爱国

    Abstract: 本发明公开了一种基于全驱系统理论的挠性航天器姿态控制方法,所述方法利用挠性航天器的动力学模型,并考虑外部环境干扰,通过状态同胚变换将挠性航天器系统转化为全驱系统,以解决挠性航天器的姿态控制问题,采用观测器和自适应律来估计航天器的挠性模态和外部环境干扰,结合全驱系统方法的参数化设计,进一步设计得出控制律,实现挠性航天器的精确姿态控制。该方法能够将挠性航天器系统与全驱系统框架相结合,从而实现了更高精度、更灵活和更适应多样任务需求的姿态控制,通过状态变换和设计挠性观测器,为航天器任务的成功执行提供了坚实的技术支持。

Patent Agency Ranking