一种基于多约束目标的水下机器人运动规划方法
摘要:
一种基于多约束目标的水下机器人运动规划方法,属于机器学习以及水下机器人运动规划领域。模型构建阶段:将机器人避障声呐的信号与流速传感器的流速信号转化为当前环境;根据动力学约束,建立离散动作空间;以水下障碍物作为约束,建立奖赏函数;基于多目标约束建立马尔可夫决策过程,为算法实现建立基础;训练阶段:基于Q学习算法进行训练,在当前环境,基于贪心策略执行动作,每执行一步策略,基于原始策略进行评估并更新一次策略,改进策略直到适应环境,实现规划目的。本发明考虑了水流、碍航物、目标等多约束目标,将强化学习方法与水下多约束目标结合,实现了水下机器人的运动规划,具有较强的实时性,并且可以适用于多种环境。
0/0