一种基于持续强化学习的机械臂避障抓取方法

    公开(公告)号:CN115042185A

    公开(公告)日:2022-09-13

    申请号:CN202210788006.4

    申请日:2022-07-04

    Abstract: 本发明涉及一种基于持续强化学习的机械臂避障抓取方法,包括:获取并执行第一阶段任务,当训练周期内获得的奖励达到阈值,且各训练周期内所获得的奖励差值位于阈值内时,执行第二阶段任务;获取并执行第二阶段任务,当训练周期内获得的奖励达到阈值,且各训练周期内所获得的奖励差值位于阈值内时,执行第三阶段任务;获取并执行第三阶段任务,当训练周期内获得的奖励达到阈值,且各训练周期内所获得的奖励差值位于阈值内时,训练完成;所述第三阶段障碍物其位置随机生成,本发明针对实际工业环境,结合抓握和避障设置环境和任务并提出了一种更有效的状态表示和奖励设计,从而提高了机器人在该任务上的学习效果。

Patent Agency Ranking