一种结合改进人工势场法和深度强化学习的多机械臂路径规划方法

    公开(公告)号:CN119658694A

    公开(公告)日:2025-03-21

    申请号:CN202510007568.4

    申请日:2025-01-03

    Inventor: 吴迪 葛佳琦 王欣

    Abstract: 本发明涉及机械臂运动规划领域,涉及一种基于改进人工势场法和深度强化学习多机械臂运动规划方法,针对深度强化学习在多机械臂系统中,前期奖励稀疏,训练速度较慢,难以学习到有效策略的特点,本发明提出了改进的动态人工势场专家演示方案,通过在训练过程中,添加随着训练进程动态改变的人工势场奖励函数和动态人工势场专家演示机制,使得机械臂在前期的训练过程中获得更高的学习效率并获得更多的正样本,在后期训练中辅助机械臂到达高精度目标,进而加快机械臂的学习速度。训练过程主要包括以下步骤:构建仿真环境,对多机械臂路径规划任务进行描述和建模,生成训练样本,执行训练任务并进行仿真,根据仿真结果动态调整专家数据,经验收集和策略更新。相比于传统方法,本方法具有更快的收敛速度,更短的训练时间以及更高的精度,尤其是具有更快的前期收敛速度和较高的拟合精度。

Patent Agency Ranking