基于深度强化学习的机械臂移动目标抓取优化训练方法

发明公开

CN118024244A 基于深度强化学习的机械臂移动目标抓取优化训练方法审中-实审

请登陆查看更多内容

专利标题： 基于深度强化学习的机械臂移动目标抓取优化训练方法
申请号： CN202410217848.3

申请日： 2024-02-28
公开(公告)号： CN118024244A

公开(公告)日： 2024-05-14
发明人: 程淑红 , 杨木天 , 张典范 , 张仕军 , 蒋政 , 朱玉杰
申请人： 燕山大学
申请人地址： 河北省秦皇岛市海港区河北大街438号
专利权人： 燕山大学
当前专利权人： 燕山大学
当前专利权人地址： 河北省秦皇岛市海港区河北大街438号
代理机构： 石家庄众志华清知识产权事务所
代理商 张建
主分类号： B25J9/16
IPC分类号： B25J9/16

摘要：

本发明公开了基于深度强化学习的机械臂移动目标抓取优化训练方法，属于机械臂控制以及深度强化学习领域，包括将机械臂对移动目标抓取的问题建立成强化学习环境模型，利用视觉传感器获取移动目标当前的状态信息，将获得的状态信息作为神经网络的输入，输出可选动作的概率分布，并将状态动作转换元组存入经验池。使用具有优先级动态后视经验回放技术对经验池进行排序与扩充并对Actor‑Critic网络进行训练。通过连续的训练迭代，可以得到机械臂移动目标抓取的最优策略。本发明能够加机械臂移动目标抓取的训练速度，更快学到最优控制策，为实现更高级别的自动化控制提供了有力的工具。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

B	作业；运输
B25	手动工具；轻便机动工具；手动器械的手柄；车间设备；机械手
B25J	机械手；装有操纵装置的容器（单独采摘水果、蔬菜、啤酒花或类似作物的自动装置入A01D46/30；外科用的针头操纵器入A61B17/062；与滚轧机有关的机械手入B21B39/20；与锻压机有关的机械手入B21J13/10；夹持轮子或其部件的装置入B60B30/00；起重机入B66C；用于核反应堆中所用的燃料或其他材料的处理设备入G21C19/00；机械手与加有防辐射的小室或房间的组合结构入G21F7/06）
B25J9/00	程序控制机械手
B25J9/16	.程序控制（全面生产控制，即集中控制多台机器入G05B19/418）