基于DQN模型的多巡检机器人协同路径规划方法及系统
摘要:
基于DQN模型的多巡检机器人协同路径规划方法及系统,获取所有巡检机器人位置坐标及各任务点抵达状态构建多巡检机器人协同的状态空间;获取所有巡检机器人选择的移动方向构建多巡检机器人协同的动作空间;以巡检机器人与障碍物之间触发防碰撞机制、巡检机器人之间触发防碰撞机制为约束条件对状态进行分类,并定义各类状态对应的奖励值;根据状态、动作以及奖励值,DQN模型计算在设定状态下执行设定动作后获得的回报值的期望,并通过深度神经网络参数训练对期望进行优化,以最大期望对应的状态和动作构成多巡检机器人协同路径。本发明不仅能避开障碍物而且多巡检机器人间不触发防碰撞机制,从而减少能耗损失,提升多机器人协同巡检效率。
0/0