-
公开(公告)号:CN118466562A
公开(公告)日:2024-08-09
申请号:CN202410620610.5
申请日:2024-05-20
Applicant: 兰州大学
IPC: G05D1/49
Abstract: 本发明公开了基于双时延深度确定性策略梯度的船舶姿态控制方法,包含以下步骤:(1)根据强化学习原理,构建状态空间S、动作空间A和奖励函数R;(2)训练双时延确定性策略梯度算法,得到收敛的策略函数;(3)在模拟系统中使用策略和模拟状态,检测策略的安全性和稳定性;(4)在实际航行中使用策略和真实状态测试策略的安全性和稳定性;(5)迭代执行步骤s102至s104,直至船舶获得在复杂多变海域的安全性和稳定性。本发明使得船舶动力系统能够动态自适应调节,克服传统控制方法的依赖预设规则和经验、无法实时响应、没有考虑船舶能耗等因素带来的影响,在保证船舶整体的安全性前提下,尽可能提高乘客的乘坐舒适性以及货物运输的安全性。