-
公开(公告)号:CN116062059B
公开(公告)日:2024-06-14
申请号:CN202310087358.1
申请日:2023-02-09
Applicant: 北京理工大学
IPC: B62D57/032 , G06F30/27
Abstract: 本发明公开了一种基于深度强化学习的单腿机器人连续跳跃控制方法,根据机器人正运动学计算实时腿长,并将实时腿长与有限状态机中预设的目标腿长进行对比,判断是否进行跳跃阶段切换;虚拟弹簧‑阻尼模根据当前跳跃阶段计算足部末端虚拟力,进而得到所需的关节力矩,控制机器人进行运动;虚拟弹簧‑阻尼模型中的刚度、阻尼由策略网络的输出——动作空间信息进行更新,有限状态机中预设的目标腿长根据算法中的相应设置进行更新,且策略网络根据奖励数值以固定周期进行优化。本发明方法避免人工设计的控制器存在的繁琐且低效的参数调优过程,实现机器人实时根据自身运动情况在线自主决策有实时变化需求的运动因素。
-
公开(公告)号:CN116062059A
公开(公告)日:2023-05-05
申请号:CN202310087358.1
申请日:2023-02-09
Applicant: 北京理工大学
IPC: B62D57/032 , G06F30/27
Abstract: 本发明公开了一种基于深度强化学习的单腿机器人连续跳跃控制方法,根据机器人正运动学计算实时腿长,并将实时腿长与有限状态机中预设的目标腿长进行对比,判断是否进行跳跃阶段切换;虚拟弹簧‑阻尼模根据当前跳跃阶段计算足部末端虚拟力,进而得到所需的关节力矩,控制机器人进行运动;虚拟弹簧‑阻尼模型中的刚度、阻尼由策略网络的输出——动作空间信息进行更新,有限状态机中预设的目标腿长根据算法中的相应设置进行更新,且策略网络根据奖励数值以固定周期进行优化。本发明方法避免人工设计的控制器存在的繁琐且低效的参数调优过程,实现机器人实时根据自身运动情况在线自主决策有实时变化需求的运动因素。
-