-
公开(公告)号:CN116909290A
公开(公告)日:2023-10-20
申请号:CN202311070489.5
申请日:2023-08-24
IPC: G05D1/02
Abstract: 本发明无人艇路径跟踪控制技术领域,具体公开了一种基于优先经验回放的近端策略优化水上无人艇路径跟踪方法、计算机设备及存储介质。所述方法包括设置优先经验回放记忆池、动作空间、状态空间和奖励函数;基于近端策略优化算法构建网络模型,利用优先经验回放记忆池中的样本对网络模型进行训练;根据无人艇获取的图像、当前无人艇的位置信息以及参考轨迹上的匹配点的位置信息生成当前的状态信息;基于优先级采样数据,优先训练动作效果差的样本。本发明采用优先经验回放记忆池保证了模型的快速收敛,网络模型基于近端策略优化构建,采用结合环境状况设置的状态空间和奖励函数,提高了算法对于环境的适应性和稳定性。
-
公开(公告)号:CN119063733A
公开(公告)日:2024-12-03
申请号:CN202411187545.8
申请日:2024-08-28
Abstract: 本发明涉及机器人控制技术领域,具体公开了一种基于深度强化学习的四足机器人路径规划方法、计算机设备及存储介质,包括以下步骤:S1、创建地面越障仿真环境;S2、参数初始化;S3、部署控制算法;S4、环境感知;S5、生成融合动作;S6、执行动作;S7、循环动作;本发明通过设置两种类型状态的输入通道,能够获得环境的完备信息;通过部署多种控制算法,可以将多种控制算法的输出进行融合,生成融合动作,有效提高了四足机器人动作生成的准确性。
-
公开(公告)号:CN118276583A
公开(公告)日:2024-07-02
申请号:CN202410352550.3
申请日:2024-03-26
Applicant: 济宁学院 , 山东理工精密机械有限公司 , 上海大学
Abstract: 本发明属于无人艇技术领域,具体公开一种基于深度强化学习的无人艇目标跟踪方法、电子设备及存储介质。所述方法包括:创建训练所需要的海面虚拟环境;设置优先经验回放记忆池、状态空间、动作空间和奖励函数;创建未来状态预测奖励框架;策略网络基于竞争Q网络构建;无人艇搭载雷达传感器用于感知环境;目标根据预设的轨迹在海面运动。本发明通过设置未来状态预测奖励框架使无人艇能够提前获得下一时刻的部分状态信息,因此可以提前为未来的状态做出决策,这对于规避动态障碍物、捕捉动态目标具有重要作用。
-
公开(公告)号:CN118131775A
公开(公告)日:2024-06-04
申请号:CN202410339991.X
申请日:2024-03-25
IPC: G05D1/43 , G05D109/30
Abstract: 本发明属于无人艇路径规划技术领域,具体公开了一种基于强化学习的轻量化无人艇路径规划方法、电子设备及存储介质,其方法包括创建无人艇虚拟仿真环境,设置目标位置和阈值;设置分类经验池、状态空间、动作空间和奖励函数;基于PPO算法建立网络模型,利用分类经验池中储存的样本对网络模型进行训练;所述分类经验池包括成功探索经验池和失败探索经验池;无人艇搭载激光雷达传感器,通过激光雷达采集的点云信息感知环境;通过无人艇与仿真环境交互获得策略网络的训练数据,采用获得的训练数据对策略网络进行训练,直至无人艇能够完成无碰撞的路径规划;所述训练数据须经过预处理将点云数据中的冗余信息去除。
-
公开(公告)号:CN116859964A
公开(公告)日:2023-10-10
申请号:CN202311070491.2
申请日:2023-08-24
IPC: G05D1/06
Abstract: 本发明属于无人艇技术领域,具体公开一种基于优先级竞争深度双Q网络的水面无人艇避障方法、电子设备及存储介质。所述方法包括:创建无人艇仿真环境;设置优先经验回放记忆池、状态空间、动作空间和奖励函数;无人艇上搭载相机和风速风向传感器,用于获取图像和风速风向信息;基于竞争Q网络和双Q网络构建策略模型,创建优先经验回放记忆池,使用优先经验回放记忆池里的样本进行模型的训练。本发明通过将优先经验回放记忆池和竞争深度双Q网络相结合,大大提高了模型训练的速度和稳定性,将双Q网络的设计思想考虑到策略模型中去,大大缓解了Q学习的过估计问题,将风速风向考虑到状态中,能够保证策略模型可以根据环境输出更准确的动作。
-
公开(公告)号:CN118276582A
公开(公告)日:2024-07-02
申请号:CN202410352272.1
申请日:2024-03-26
Applicant: 济宁学院 , 山东理工精密机械有限公司 , 上海大学
Abstract: 本发明属于无人艇技术领域,具体涉及一种基于好奇心驱动的多无人艇协同目标探索方法、电子设备和存储介质。所述方法包括创建多无人艇仿真训练环境;设置好奇心驱动模块、状态共享池、状态空间、动作空间和奖励函数;无人艇上搭载相机;策略模型基于深度确定性策略梯度算法构建,使用状态共享池里的样本对模型进行训练。本发明通过设置状态共享池,大大提高了无人艇搜索环境的效率,同时增强了无人艇之间的合作性。好奇心模块的设置可以提高无人艇对未知领域的探索兴趣,提高对环境的探索程度,从而提高目标探索的效率。
-
公开(公告)号:CN119555099A
公开(公告)日:2025-03-04
申请号:CN202411161754.5
申请日:2024-08-23
Applicant: 上海大学
IPC: G01C21/34
Abstract: 本申请公开了一种无人车自主路径规划方法、设备、介质及产品,涉及自动驾驶技术领域,该方法包括构建状态融合修正框架;所述状态融合修正框架包括:动作预测网络、状态预测网络和状态融合模块;基于深度增强学习算法,构建策略网络;所述策略网络用于根据融合状态输出执行的动作;根据状态融合修正框架和策略网络确定路径规划模型;根据目标位置、无人车位置以及雷达点云信息确定待规划无人车的状态;根据待规划无人车的状态,采用训练好的路径规划模型,得到执行的动作。本申请能够提高无人车的路径规划能力。
-
-
-
-
-
-