-
公开(公告)号:CN118163111A
公开(公告)日:2024-06-11
申请号:CN202410454938.4
申请日:2024-04-16
Applicant: 哈尔滨工程大学
IPC: B25J9/16
Abstract: 本发明一种基于深度强化学习的机械臂推抓协同方法,属于视觉机器人抓取领域,为解决无模型训练在训练初期样本利用率低,且经验池回放过程往往不能突出样本重要性,无法达到满意的训练效果的问题;以及由于抓取目标的不明确导致抓取成功率较低的问题。本发明通过计算目标中心分散度度量,选取抓取难度最小的物体作为目标抓取物体,并根据目标物体生成对应的掩膜图像;建立基于FCN网络和DQN算法框架的预测模型,通过网络主干对RGB‑D图像、RGB‑D高度图像以及掩膜图像分别进行特征提取,采用G‑Net和P‑Net进行特征融合和上采样,得到两个的Q值热力图;采用优先级经验回放方法从经验池中进行采样并进行模型参数更新,最终得到预测模型完成任务场景中的推抓操作。