-
公开(公告)号:CN118322197A
公开(公告)日:2024-07-12
申请号:CN202410479073.7
申请日:2024-04-21
Applicant: 哈尔滨理工大学
IPC: B25J9/16
Abstract: 本发明提出了一种基于模型解空间快速自收敛的机械臂智能抓取方法,旨在解决现有深度强化学习算法训练机械臂执行智能抓取任务时模型解空间维度过高导致的最优解丢失、模型收敛速度慢等技术问题。该方法首先采用改进YOLOv8网络结合GraspNet端到端抓取网络实现对指定物体的检测识别和6D抓取位姿估计。接下来,设计基于位姿的离散型奖励函数以适应高精度抓取任务,同时设计基于位姿‑能量约束的密集型非线性奖励函数,在保证低能耗的前提下降低机械臂在高维解空间下探索导致的抖动使深度强化学习DDPG模型快速收敛到最优解。然后,提出一种新型的深度强化学习算法R‑DDPG并在仿真环境中训练R‑DDPG算法,利用RRT算法的专家经验对DDPG算法训练前期的探索过程进行引导,解决DDPG算法训练初期面临高维度解空间时探索效率较低的问题,提高模型收敛速度。最后,将训练好的R‑DDPG模型迁移到实物机械臂上并结合视觉模块输出的抓取位姿信息进行抓取操作。