发明公开
摘要:
本发明公开了基于深度强化学习的机械臂移动目标抓取优化训练方法,属于机械臂控制以及深度强化学习领域,包括将机械臂对移动目标抓取的问题建立成强化学习环境模型,利用视觉传感器获取移动目标当前的状态信息,将获得的状态信息作为神经网络的输入,输出可选动作的概率分布,并将状态动作转换元组存入经验池。使用具有优先级动态后视经验回放技术对经验池进行排序与扩充并对Actor‑Critic网络进行训练。通过连续的训练迭代,可以得到机械臂移动目标抓取的最优策略。本发明能够加机械臂移动目标抓取的训练速度,更快学到最优控制策,为实现更高级别的自动化控制提供了有力的工具。
IPC分类: