-
公开(公告)号:CN115042178B
公开(公告)日:2025-05-23
申请号:CN202210744763.1
申请日:2022-06-27
Applicant: 清华大学
IPC: B25J9/16
Abstract: 本申请公开了一种保证接触安全的机器人强化学习方法、装置、设备及介质,其中,方法包括:获取机器人目标任务;利用强化学习策略生成目标任务的笛卡尔空间变阻抗控制的参数,并根据姿态约束生成约束动作;若机器人未发生碰撞,则根据笛卡尔空间变阻抗控制的参数和约束动作生成第一执行动作,并控制机器人按照第一执行动作执行目标任务,否则根据碰撞力大小计算变阻抗控制补偿量,补偿笛卡尔空间变阻抗控制的参数的同时,修正姿态约束生成补偿约束动作,并生成第二执行动作,控制机器人按照第二执行动作执行目标任务。由此,解决了现有的方法无法避免意外碰撞,导致在混乱或未知的环境中产生非预期的危险行为,且未考虑关节空间的接触安全等问题。
-
公开(公告)号:CN115042178A
公开(公告)日:2022-09-13
申请号:CN202210744763.1
申请日:2022-06-27
Applicant: 清华大学
IPC: B25J9/16
Abstract: 本申请公开了一种保证接触安全的机器人强化学习方法、装置、设备及介质,其中,方法包括:获取机器人目标任务;利用强化学习策略生成目标任务的笛卡尔空间变阻抗控制的参数,并根据姿态约束生成约束动作;若机器人未发生碰撞,则根据笛卡尔空间变阻抗控制的参数和约束动作生成第一执行动作,并控制机器人按照第一执行动作执行目标任务,否则根据碰撞力大小计算变阻抗控制补偿量,补偿笛卡尔空间变阻抗控制的参数的同时,修正姿态约束生成补偿约束动作,并生成第二执行动作,控制机器人按照第二执行动作执行目标任务。由此,解决了现有的方法无法避免意外碰撞,导致在混乱或未知的环境中产生非预期的危险行为,且未考虑关节空间的接触安全等问题。
-