-
公开(公告)号:CN118938645A
公开(公告)日:2024-11-12
申请号:CN202410855321.3
申请日:2024-06-28
Applicant: 中国科学院自动化研究所
IPC: G05B11/42
Abstract: 本发明提供一种基于深度强化学习的多步态双足运动控制方法及装置,其中,上述方法包括:确定当前人形机器人的状态向量,其中,状态向量包括关节参数、髋部参数以及双腿相位参数;在仿真环境中调用预设的控制策略神经网络基于状态向量,确定预设的控制策略神经网络的输出向量;基于输出向量进行线性变换,得到期望关节角角度;基于期望关节角角度调用比例微分控制器,确定输出力矩;基于输出力矩在仿真环境中模拟人形机器人的轨迹运动,得到轨迹数据的样本数据;当样本数据的数目大于预设的最小样本值时,基于轨迹数据对预设的控制策略神经网络的网络权重进行更新,得到更新后的控制策略神经网络,以控制人形机器人进行期望步态运动。