-
公开(公告)号:CN115629607A
公开(公告)日:2023-01-20
申请号:CN202211306866.6
申请日:2022-10-25
Applicant: 湖北汽车工业学院
IPC: G05D1/02
Abstract: 本发明涉及机器人路径规划技术领域,具体涉及一种融合历史信息的强化学习路径规划方法,包括以下步骤:S1:获取环境图像,建立格栅地图;S2:定义强化学习状态空间和动作空间;S3:初始化算法参数;S4:动态调整动作空间;S5:在调整后的动作空间中,采用ε‑贪婪策略选择动作;S6:执行动作,更新Q值;S7:复执行第四步、第五步、第六步,直到达到一定步数或一定收敛条件为止;S8:每一步选择Q值最大的动作,得出最优路径;S9:把最优路径发送给移动机器人的控制器,控制移动机器人按照最优行走。
-
公开(公告)号:CN115629607B
公开(公告)日:2025-02-25
申请号:CN202211306866.6
申请日:2022-10-25
Applicant: 湖北汽车工业学院
IPC: G05D1/43
Abstract: 本发明涉及机器人路径规划技术领域,具体涉及一种融合历史信息的强化学习路径规划方法,包括以下步骤:S1:获取环境图像,建立格栅地图;S2:定义强化学习状态空间和动作空间;S3:初始化算法参数;S4:动态调整动作空间;S5:在调整后的动作空间中,采用ε‑贪婪策略选择动作;S6:执行动作,更新Q值;S7:复执行第四步、第五步、第六步,直到达到一定步数或一定收敛条件为止;S8:每一步选择Q值最大的动作,得出最优路径;S9:把最优路径发送给移动机器人的控制器,控制移动机器人按照最优行走。
-