一种基于深度强化学习的越野车三维路径规划方法

    公开(公告)号:CN115357022B

    公开(公告)日:2024-08-20

    申请号:CN202211034787.4

    申请日:2022-08-26

    Applicant: 湖南大学

    Abstract: 本发明公开了一种基于深度强化学习的越野车三维路径规划方法,构建一个基于价值的越野车三维路径规划的深度卷积神经网络模型,以最优动作价值函数为学习目标,构建随越野车移动的动态全局地图作为观测输入,设计综合考虑路程和能耗的奖励函数,根据目标距离设计深度强化学习的探索策略,最后结合探索策略和奖励函数对深度卷积神经网络模型进行端到端的训练,以使越野车从起点到终点的行驶过程中获得的奖励最大,实现越野车的三维路径规划。采用上述方法规划出的越野车三维路径,综合考虑了路程和能耗,在探索过程中可以兼顾方向性和随机性,为三维地图中的越野车规划出路程和能耗折中的节能路径。

    一种基于深度强化学习的越野车三维路径规划方法

    公开(公告)号:CN115357022A

    公开(公告)日:2022-11-18

    申请号:CN202211034787.4

    申请日:2022-08-26

    Applicant: 湖南大学

    Abstract: 本发明公开了一种基于深度强化学习的越野车三维路径规划方法,构建一个基于价值的越野车三维路径规划的深度卷积神经网络模型,以最优动作价值函数为学习目标,构建随越野车移动的动态全局地图作为观测输入,设计综合考虑路程和能耗的奖励函数,根据目标距离设计深度强化学习的探索策略,最后结合探索策略和奖励函数对深度卷积神经网络模型进行端到端的训练,以使越野车从起点到终点的行驶过程中获得的奖励最大,实现越野车的三维路径规划。采用上述方法规划出的越野车三维路径,综合考虑了路程和能耗,在探索过程中可以兼顾方向性和随机性,为三维地图中的越野车规划出路程和能耗折中的节能路径。

    一种深度强化学习的高效学习方法

    公开(公告)号:CN115979287A

    公开(公告)日:2023-04-18

    申请号:CN202211656057.8

    申请日:2022-12-22

    Applicant: 湖南大学

    Abstract: 本发明公开了一种深度强化学习的高效学习方法,应用于三维大尺寸地形环境中无人车路径规划,包括:将全局地图观测信息输入至动态全局通道;将局部地图观测信息输入至动态局部通道;通过多目标奖励函数对无人车的能耗和行驶时间进行评价;在每个训练过程中,从经验缓冲池中提取到达目标位置的若干历史经验数据作为训练集;其中,动态全局通道与动态局部通道为深度强化学习模型的两个并联输入通道;动态全局通道的第一层图像输入用于存放当前规划点的位置信息;第二层图像输入用于存放目标位置信息;第三层图像输入用于存放三维地图数据;动态局部通道的输入层设置为一层图像输入;深度强化学习模型采用基于优先经验重播的深度强化学习探索策略。

Patent Agency Ranking