Patent search ap:("清华大学") AND inv:"康书诚" Page 1

1.

发明授权
保证接触安全的机器人强化学习方法、装置、设备及介质有权

公开(公告)号：CN115042178B

公开(公告)日：2025-05-23

申请号：CN202210744763.1

申请日：2022-06-27

Applicant: 清华大学

Inventor： 陈建宇 , 朱翔 , 康书诚

IPC: B25J9/16

Abstract: 本申请公开了一种保证接触安全的机器人强化学习方法、装置、设备及介质，其中，方法包括：获取机器人目标任务；利用强化学习策略生成目标任务的笛卡尔空间变阻抗控制的参数，并根据姿态约束生成约束动作；若机器人未发生碰撞，则根据笛卡尔空间变阻抗控制的参数和约束动作生成第一执行动作，并控制机器人按照第一执行动作执行目标任务，否则根据碰撞力大小计算变阻抗控制补偿量，补偿笛卡尔空间变阻抗控制的参数的同时，修正姿态约束生成补偿约束动作，并生成第二执行动作，控制机器人按照第二执行动作执行目标任务。由此，解决了现有的方法无法避免意外碰撞，导致在混乱或未知的环境中产生非预期的危险行为，且未考虑关节空间的接触安全等问题。

2.

发明公开
保证接触安全的机器人强化学习方法、装置、设备及介质有权

公开(公告)号：CN115042178A

公开(公告)日：2022-09-13

申请号：CN202210744763.1

申请日：2022-06-27

Applicant: 清华大学

Inventor： 陈建宇 , 朱翔 , 康书诚

IPC: B25J9/16

Abstract: 本申请公开了一种保证接触安全的机器人强化学习方法、装置、设备及介质，其中，方法包括：获取机器人目标任务；利用强化学习策略生成目标任务的笛卡尔空间变阻抗控制的参数，并根据姿态约束生成约束动作；若机器人未发生碰撞，则根据笛卡尔空间变阻抗控制的参数和约束动作生成第一执行动作，并控制机器人按照第一执行动作执行目标任务，否则根据碰撞力大小计算变阻抗控制补偿量，补偿笛卡尔空间变阻抗控制的参数的同时，修正姿态约束生成补偿约束动作，并生成第二执行动作，控制机器人按照第二执行动作执行目标任务。由此，解决了现有的方法无法避免意外碰撞，导致在混乱或未知的环境中产生非预期的危险行为，且未考虑关节空间的接触安全等问题。

Patent Agency Ranking