-
公开(公告)号:CN120043522A
公开(公告)日:2025-05-27
申请号:CN202411889064.1
申请日:2024-12-20
Applicant: 桂林电子科技大学
Abstract: 本发明公布了基于改进DQN算法的路径规划方法,路径规划方法的目的是选择无碰撞路径到达理想位置。路径规划要解决到达目标、绕开障碍等问题,传统方法需预设环境地图。深度强化学习用于解决动态路径规划问题,常见路径规划方法分离线和在线。DRL通过试错与环境交互学习最优策略,DQN算法在路径规划中有应用但存在收敛慢等问题。本发明提出改进的DQN路径规划算法及系统,通过改进奖励函数、动作选择策略,引入先验知识和优先经验重放解决问题。包括构建二维栅格网络环境地图,基于此和马尔可夫决策过程构建并改进优化DQN路径规划模型,改进策略涵盖奖励塑造、设计衰减的ε‑greedy策略、引入先验知识和优先经验重放。