一种室内移动机器人强化学习导航方法

    公开(公告)号:CN116088495A

    公开(公告)日:2023-05-09

    申请号:CN202211416730.0

    申请日:2022-11-14

    Applicant: 中北大学

    Abstract: 本发明属于强化学习领域,具体涉及一种室内移动机器人强化学习导航方法,为解决在复杂环境复杂奖励的情况下,智能体导航中的样本利用率低以及导航成功率不高的问题,本发明在D3QN算法基础上,引入优势后见经验回放算法和分层强化学习结构。首先,通过比较不同轨迹点的优势函数来选择新目标点,拥有最大优势函数的轨迹点作为新目标点,根据新目标点,对轨迹样本重新标记并存入经验池中。然后,在分层强化学习的结构下,训练智能体在复杂的环境下学习,顶层智能体负责学习大范围的路径规划,底层智能体负责导航到子目标,最后实现到总目标点的导航。

Patent Agency Ranking