一种基于双BP网络增强学习框架的水下机器人轨迹跟踪方法

发明公开

CN111240345A 一种基于双BP网络增强学习框架的水下机器人轨迹跟踪方法有权

请登陆查看更多内容

专利标题： 一种基于双BP网络增强学习框架的水下机器人轨迹跟踪方法
申请号： CN202010087514.0

申请日： 2020-02-11
公开(公告)号： CN111240345A

公开(公告)日： 2020-06-05
发明人: 孙延超 , 张佩 , 王卓 , 秦洪德 , 李鹏 , 景锐洁 , 曹禹 , 张宇昂
申请人： 哈尔滨工程大学
申请人地址： 黑龙江省哈尔滨市南岗区南通大街145号
专利权人： 哈尔滨工程大学
当前专利权人： 哈尔滨工程大学
当前专利权人地址： 黑龙江省哈尔滨市南岗区南通大街145号
代理机构： 哈尔滨市松花江专利商标事务所
代理商 时起磊
主分类号： G05D1/06
IPC分类号： G05D1/06

摘要：

一种基于双BP网络增强学习框架的水下机器人轨迹跟踪方法，它属于水下机器人轨迹跟踪技术领域。本发明解决了现有技术在进行控制器参数的在线优化时，需要依赖大量的专家先验知识建立模糊规则，导致控制器参数的在线优化耗时耗力的问题。本发明利用强化学习方法可以通过与环境的不断交互，在得到环境给出的强化值后便能通过循环迭代寻找到最优策略的特点，将强化学习方法与双BP网络结合起来，通过在线调节水下机器人的速度和艏向控制系统控制律的相关参数，使得所设计的速度和艏向控制系统能在不同的环境中选择与该环境相对应的最优控制参数，克服了现有技术中控制器参数在线优化的耗时耗力的问题。本发明可以应用于水下机器人的轨迹跟踪。

公开/授权文献

CN111240345B 基于双BP网络增强学习框架的水下机器人轨迹跟踪方法公开/授权日：2023-04-07

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G05	控制；调节
G05D	非电变量的控制或调节系统（金属的连续铸造入B22D11/16；阀门本身入F16K；非电变量的检测见G01各有关小类；电或磁变量的调节入G05F）
G05D1/00	陆地、水上、空中或太空中的运载工具的位置、航道、高度或姿态的控制，例如自动驾驶仪（无线电导航系统或使用其他波的类似系统入G01S）
G05D1/04	.高度或深度的控制
G05D1/06	..高度或深度的变化率