一种基于双BP网络增强学习框架的水下机器人轨迹跟踪方法
摘要:
一种基于双BP网络增强学习框架的水下机器人轨迹跟踪方法,它属于水下机器人轨迹跟踪技术领域。本发明解决了现有技术在进行控制器参数的在线优化时,需要依赖大量的专家先验知识建立模糊规则,导致控制器参数的在线优化耗时耗力的问题。本发明利用强化学习方法可以通过与环境的不断交互,在得到环境给出的强化值后便能通过循环迭代寻找到最优策略的特点,将强化学习方法与双BP网络结合起来,通过在线调节水下机器人的速度和艏向控制系统控制律的相关参数,使得所设计的速度和艏向控制系统能在不同的环境中选择与该环境相对应的最优控制参数,克服了现有技术中控制器参数在线优化的耗时耗力的问题。本发明可以应用于水下机器人的轨迹跟踪。
0/0