一种基于强化学习的轻量化无人艇路径规划方法、电子设备及存储介质

    公开(公告)号:CN118131775A

    公开(公告)日:2024-06-04

    申请号:CN202410339991.X

    申请日:2024-03-25

    IPC分类号: G05D1/43 G05D109/30

    摘要: 本发明属于无人艇路径规划技术领域,具体公开了一种基于强化学习的轻量化无人艇路径规划方法、电子设备及存储介质,其方法包括创建无人艇虚拟仿真环境,设置目标位置和阈值;设置分类经验池、状态空间、动作空间和奖励函数;基于PPO算法建立网络模型,利用分类经验池中储存的样本对网络模型进行训练;所述分类经验池包括成功探索经验池和失败探索经验池;无人艇搭载激光雷达传感器,通过激光雷达采集的点云信息感知环境;通过无人艇与仿真环境交互获得策略网络的训练数据,采用获得的训练数据对策略网络进行训练,直至无人艇能够完成无碰撞的路径规划;所述训练数据须经过预处理将点云数据中的冗余信息去除。