基于深度强化学习的水下自主航行器接驳控制方法和系统

    公开(公告)号:CN117590867B

    公开(公告)日:2024-03-26

    申请号:CN202410070527.5

    申请日:2024-01-18

    Applicant: 吉林大学

    Abstract: 基于深度强化学习的水下自主航行器接驳控制方法和系统,涉及水下航行器的接驳控制领域。解决现有水下自主航行器的接驳基于导航信息的Pid控制,控制稳定性受洋流影响大,面对未知障碍物时决策能力不足的问题。方法包括:根据海洋环境数据和接驳控制任务场景构建状态空间和动作空间以及仿真环境模型;设计奖励函数;构建基于SAC改进的深度神经网络模型;初始化深度神经网络模型参数和经验重放缓冲区;深度神经网络模型根据当前环境状态信息输入,输出当前时间步下的最优决策,并与模拟环境模型交互,产生新状态并存储;训练深度神经网络模型,利用模型为水下自主航行器提供接驳控制支持。应用于水下探测领域。

    基于深度强化学习的水下自主航行器接驳控制方法和系统

    公开(公告)号:CN117590867A

    公开(公告)日:2024-02-23

    申请号:CN202410070527.5

    申请日:2024-01-18

    Applicant: 吉林大学

    Abstract: 基于深度强化学习的水下自主航行器接驳控制方法和系统,涉及水下航行器的接驳控制领域。解决现有水下自主航行器的接驳基于导航信息的Pid控制,控制稳定性受洋流影响大,面对未知障碍物时决策能力不足的问题。方法包括:根据海洋环境数据和接驳控制任务场景构建状态空间和动作空间以及仿真环境模型;设计奖励函数;构建基于SAC改进的深度神经网络模型;初始化深度神经网络模型参数和经验重放缓冲区;深度神经网络模型根据当前环境状态信息输入,输出当前时间步下的最优决策,并与模拟环境模型交互,产生新状态并存储;训练深度神经网络模型,利用模型为水下自主航行器提供接驳控制支持。应用于水下探测领域。

Patent Agency Ranking