-
公开(公告)号:CN119440072A
公开(公告)日:2025-02-14
申请号:CN202411493430.1
申请日:2024-10-24
Applicant: 大连海事大学
IPC: G05D1/485 , G05D1/65 , G05D1/633 , G05D1/644 , G05D101/10
Abstract: 本发明提供一种用于未知环境的水下机器人路径规划方法,水下机器人路径规划技术领域。本发明通过M‑DQN水下机器人路径规划模型进行未知环境水下路径规划,其训练为:水下机器人通过MOA机制选择下一步动作与水下环境进行交互;根据交互反馈通过奖励机制对当前动作进行奖励或惩罚,并将动作经验存储至分层经验池中;当动作经验积累到预设数量时,从分层经验池中利用分层提取机制提取批量动作经验进行学习;循环上述过程直到触碰障碍物或抵达目标点,结束本轮学习;对每轮学习进行评估,根据评估结果进行奖励回馈,被回馈的奖励值将参与下一轮的训练。提升了水下机器人的学习效率,避免了传统方法中因训练不充分而导致的路径规划精度不足的问题。