-
公开(公告)号:CN110209152A
公开(公告)日:2019-09-06
申请号:CN201910514354.0
申请日:2019-06-14
Applicant: 哈尔滨工程大学
Abstract: 本发明提供的是一种智能水下机器人垂直面路径跟随的深度强化学习控制方法。步骤一,根据智能水下机器人的路径跟随控制要求,建立与代理人进行交互的智能水下机器人环境;步骤二,建立代理人集合;步骤三,建立经验缓存池;步骤四,建立学习者;步骤五,使用分布式确定性策略梯度进行智能水下机器人路径跟随控制。本发明针对智能水下机器人所处海洋环境复杂多变,传统控制方法无法与环境主动进行交互的现象,设计智能水下机器人垂直面路径跟随的深度强化学习控制方法。使用确定性策略梯度通过分布式的方法来完成智能水下机器人的路径跟随控制任务,具有自学习,精度高,适应性好,学习过程稳定的优点。
-
公开(公告)号:CN110209152B
公开(公告)日:2022-04-05
申请号:CN201910514354.0
申请日:2019-06-14
Applicant: 哈尔滨工程大学
Abstract: 本发明提供的是一种智能水下机器人垂直面路径跟随的深度强化学习控制方法。步骤一,根据智能水下机器人的路径跟随控制要求,建立与代理人进行交互的智能水下机器人环境;步骤二,建立代理人集合;步骤三,建立经验缓存池;步骤四,建立学习者;步骤五,使用分布式确定性策略梯度进行智能水下机器人路径跟随控制。本发明针对智能水下机器人所处海洋环境复杂多变,传统控制方法无法与环境主动进行交互的现象,设计智能水下机器人垂直面路径跟随的深度强化学习控制方法。使用确定性策略梯度通过分布式的方法来完成智能水下机器人的路径跟随控制任务,具有自学习,精度高,适应性好,学习过程稳定的优点。
-