基于优先经验回放的近端策略优化水上无人艇路径跟踪方法、计算机设备及存储介质

    公开(公告)号:CN116909290A

    公开(公告)日:2023-10-20

    申请号:CN202311070489.5

    申请日:2023-08-24

    Abstract: 本发明无人艇路径跟踪控制技术领域,具体公开了一种基于优先经验回放的近端策略优化水上无人艇路径跟踪方法、计算机设备及存储介质。所述方法包括设置优先经验回放记忆池、动作空间、状态空间和奖励函数;基于近端策略优化算法构建网络模型,利用优先经验回放记忆池中的样本对网络模型进行训练;根据无人艇获取的图像、当前无人艇的位置信息以及参考轨迹上的匹配点的位置信息生成当前的状态信息;基于优先级采样数据,优先训练动作效果差的样本。本发明采用优先经验回放记忆池保证了模型的快速收敛,网络模型基于近端策略优化构建,采用结合环境状况设置的状态空间和奖励函数,提高了算法对于环境的适应性和稳定性。

    一种基于强化学习的轻量化无人艇路径规划方法、电子设备及存储介质

    公开(公告)号:CN118131775A

    公开(公告)日:2024-06-04

    申请号:CN202410339991.X

    申请日:2024-03-25

    Abstract: 本发明属于无人艇路径规划技术领域,具体公开了一种基于强化学习的轻量化无人艇路径规划方法、电子设备及存储介质,其方法包括创建无人艇虚拟仿真环境,设置目标位置和阈值;设置分类经验池、状态空间、动作空间和奖励函数;基于PPO算法建立网络模型,利用分类经验池中储存的样本对网络模型进行训练;所述分类经验池包括成功探索经验池和失败探索经验池;无人艇搭载激光雷达传感器,通过激光雷达采集的点云信息感知环境;通过无人艇与仿真环境交互获得策略网络的训练数据,采用获得的训练数据对策略网络进行训练,直至无人艇能够完成无碰撞的路径规划;所述训练数据须经过预处理将点云数据中的冗余信息去除。

    基于优先级竞争深度双Q网络的不同风速风向下水面无人艇自主避障方法、电子设备及存储介质

    公开(公告)号:CN116859964A

    公开(公告)日:2023-10-10

    申请号:CN202311070491.2

    申请日:2023-08-24

    Abstract: 本发明属于无人艇技术领域,具体公开一种基于优先级竞争深度双Q网络的水面无人艇避障方法、电子设备及存储介质。所述方法包括:创建无人艇仿真环境;设置优先经验回放记忆池、状态空间、动作空间和奖励函数;无人艇上搭载相机和风速风向传感器,用于获取图像和风速风向信息;基于竞争Q网络和双Q网络构建策略模型,创建优先经验回放记忆池,使用优先经验回放记忆池里的样本进行模型的训练。本发明通过将优先经验回放记忆池和竞争深度双Q网络相结合,大大提高了模型训练的速度和稳定性,将双Q网络的设计思想考虑到策略模型中去,大大缓解了Q学习的过估计问题,将风速风向考虑到状态中,能够保证策略模型可以根据环境输出更准确的动作。

    一种无人车自主路径规划方法、设备、介质及产品

    公开(公告)号:CN119555099A

    公开(公告)日:2025-03-04

    申请号:CN202411161754.5

    申请日:2024-08-23

    Applicant: 上海大学

    Abstract: 本申请公开了一种无人车自主路径规划方法、设备、介质及产品,涉及自动驾驶技术领域,该方法包括构建状态融合修正框架;所述状态融合修正框架包括:动作预测网络、状态预测网络和状态融合模块;基于深度增强学习算法,构建策略网络;所述策略网络用于根据融合状态输出执行的动作;根据状态融合修正框架和策略网络确定路径规划模型;根据目标位置、无人车位置以及雷达点云信息确定待规划无人车的状态;根据待规划无人车的状态,采用训练好的路径规划模型,得到执行的动作。本申请能够提高无人车的路径规划能力。

Patent Agency Ranking