-
公开(公告)号:CN115179280A
公开(公告)日:2022-10-14
申请号:CN202210705509.0
申请日:2022-06-21
Applicant: 南京大学
IPC: B25J9/16
Abstract: 本发明公开一种用于强化学习机械臂控制中基于磁场的奖励塑形方法,包括:S1、设计任务环境,设定机械臂、目标物和障碍物的相关参数,设置强化学习算法的超参数;S2、将目标物和障碍物分别视为与其同等形状的永磁体,确定三维空间磁场强度分布的计算方式;S3、机械臂与环境交互,收集训练数据,计算机械臂末端坐标在目标物和障碍物磁场中的磁场强度,得到磁场奖励函数;S4、利用DPBA算法将磁场奖励函数转换为基于势能的塑形奖励函数,与训练数据一起存放至经验回放池;S5、从经验回放池中采集一个批次的数据,使用强化学习算法训练机械臂完成规定任务。本发明能够为机械臂提供目标物和障碍物更为丰富的方位信息,从而提高强化学习算法的学习效率。