一种基于改进Sarsa算法的路径规划方法

    公开(公告)号:CN113467481A

    公开(公告)日:2021-10-01

    申请号:CN202110918358.2

    申请日:2021-08-11

    IPC分类号: G05D1/02

    摘要: 一种基于改进Sarsa算法的路径规划方法,属于强化学习和路径规划领域。本发明为了解决基于传统Sarsa算法的路径规划过程存在规划收敛速度较慢、规划效率较低的问题。本发明针对于待进行路径规划的区域建立地图模型,引入路径矩阵P(s,a),在智能体探索的过程中,动态调整贪婪因子ε,采用ε‑greedy策略进行动作选择,智能体采取动作a后,环境会反馈一个奖励R并进入到下一个状态s′;并基于路径矩阵更新Q值表,从而基于改进的Sarsa算法实现路径规划。主要用于机器人的路径规划。

    一种基于改进Sarsa算法的路径规划方法

    公开(公告)号:CN113467481B

    公开(公告)日:2022-10-25

    申请号:CN202110918358.2

    申请日:2021-08-11

    IPC分类号: G05D1/02

    摘要: 一种基于改进Sarsa算法的路径规划方法,属于强化学习和路径规划领域。本发明为了解决基于传统Sarsa算法的路径规划过程存在规划收敛速度较慢、规划效率较低的问题。本发明针对于待进行路径规划的区域建立地图模型,引入路径矩阵P(s,a),在智能体探索的过程中,动态调整贪婪因子ε,采用ε‑greedy策略进行动作选择,智能体采取动作a后,环境会反馈一个奖励R并进入到下一个状态s′;并基于路径矩阵更新Q值表,从而基于改进的Sarsa算法实现路径规划。主要用于机器人的路径规划。