Patent search ap:("杭州电子科技大学") AND inv:"蔡尚雷" Page 1

1.

发明公开
一种基于持续强化学习的机械臂避障抓取方法审中-实审

公开(公告)号：CN115042185A

公开(公告)日：2022-09-13

申请号：CN202210788006.4

申请日：2022-07-04

Applicant: 杭州电子科技大学

Inventor： 蔡尚雷 , 林志赟 , 王博 , 韩志敏

IPC: B25J9/16

Abstract: 本发明涉及一种基于持续强化学习的机械臂避障抓取方法，包括：获取并执行第一阶段任务，当训练周期内获得的奖励达到阈值，且各训练周期内所获得的奖励差值位于阈值内时，执行第二阶段任务；获取并执行第二阶段任务，当训练周期内获得的奖励达到阈值，且各训练周期内所获得的奖励差值位于阈值内时，执行第三阶段任务；获取并执行第三阶段任务，当训练周期内获得的奖励达到阈值，且各训练周期内所获得的奖励差值位于阈值内时，训练完成；所述第三阶段障碍物其位置随机生成，本发明针对实际工业环境，结合抓握和避障设置环境和任务并提出了一种更有效的状态表示和奖励设计，从而提高了机器人在该任务上的学习效果。

Patent Agency Ranking