-
公开(公告)号:CN113821045B
公开(公告)日:2023-07-07
申请号:CN202110924651.X
申请日:2021-08-12
Applicant: 浙江大学
IPC: G05D1/08
Abstract: 本发明公开了一种腿足机器人强化学习动作生成系统,该系统使用深度强化学习进行端到端训练产生动作策略,在训练过程中从仿真环境中获取输入‑输出数据进而学习到能够使奖励函数最大的运动控制策略;采用传统控制方法运行时产生的数据预训练产生初始值,确保训练过程中策略一直在参数空间内期望的极值附近,避免初始值随机产生时造成的收敛于其他局部极小值的情况;使用步态周期奖励信号鼓励训练中的智能体进行对应的周期性动作,获得有效的输入矢量。该系统可用于各种腿足构型的四足机器人的多种步态、多种动作的训练。
-
公开(公告)号:CN113821045A
公开(公告)日:2021-12-21
申请号:CN202110924651.X
申请日:2021-08-12
Applicant: 浙江大学
IPC: G05D1/08
Abstract: 本发明公开了一种腿足机器人强化学习动作生成系统,该系统使用深度强化学习进行端到端训练产生动作策略,在训练过程中从仿真环境中获取输入‑输出数据进而学习到能够使奖励函数最大的运动控制策略;采用传统控制方法运行时产生的数据预训练产生初始值,确保训练过程中策略一直在参数空间内期望的极值附近,避免初始值随机产生时造成的收敛于其他局部极小值的情况;使用步态周期奖励信号鼓励训练中的智能体进行对应的周期性动作,获得有效的输入矢量。该系统可用于各种腿足构型的四足机器人的多种步态、多种动作的训练。
-