-
公开(公告)号:CN120010495A
公开(公告)日:2025-05-16
申请号:CN202510466417.5
申请日:2025-04-15
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于深度确定性梯度策略的月球车路径规划方法,通过将距离奖励、瞬时进展奖励、瞬时航向奖励和运动平滑性奖励,构建动态多维度奖励函数机制,通过地形特征动态调节权重系数,实现多目标自适应协同;通过在不同风险地形中动态调整步长,提升月球车在不同地形下的避障精度和自主探索能力;通过动态多维度奖励函数、轻量化网络结构及自适应调整步长策略的多层次自适应机制,避免局部最优,提升路径连续性,完成月球车自主决策探测任务,实现路径规划效率与运动安全性的双重提升,解决传统强化学习在复杂月面环境中存在的收敛速度慢、路径震荡频繁、地形适应性差及模型部署效率低等核心问题,降低模型复杂度和减少对地图的依赖。