-
公开(公告)号:CN112835333B
公开(公告)日:2022-03-15
申请号:CN202011641338.7
申请日:2020-12-31
Applicant: 北京工商大学
IPC: G05B19/418
Abstract: 本发明涉及一种基于深度强化学习多AGV避障与路径规划方法及系统,其方法包括:步骤S1:每个AGV进行数据采集以及预处理,得到输入图片;步骤S2:将输入图片输入避障神经网络并进行训练,得到障碍物特征图;步骤S3:将每个AGV的障碍物特征图,输入路径规划决策模型,得到每个AGV的路径规划策略;步骤S4:每个AGV根据中央控制器所获取的所有AGV的状态‑动作对,以获取全局路径规划策略,并根据全局路径规划策略更新每个所述AGV的路径规划策略,以获得最优的全局路径规划策略。本发明采取一种多AGV的Actor‑Critic深度强化学习方法,通过分散执行‑集中学习的框架方式解决多AGV的路径规划与冲突协调的问题,同时,规避了通信协议的引入,避免了通信延迟所带来的弊端。
-
公开(公告)号:CN112835333A
公开(公告)日:2021-05-25
申请号:CN202011641338.7
申请日:2020-12-31
Applicant: 北京工商大学
IPC: G05B19/418
Abstract: 本发明涉及一种基于深度强化学习多AGV避障与路径规划方法及系统,其方法包括:步骤S1:每个AGV进行数据采集以及预处理,得到输入图片;步骤S2:将输入图片输入避障神经网络并进行训练,得到障碍物特征图;步骤S3:将每个AGV的障碍物特征图,输入路径规划决策模型,得到每个AGV的路径规划策略;步骤S4:每个AGV根据中央控制器所获取的所有AGV的状态‑动作对,以获取全局路径规划策略,并根据全局路径规划策略更新每个所述AGV的路径规划策略,以获得最优的全局路径规划策略。本发明采取一种多AGV的Actor‑Critic深度强化学习方法,通过分散执行‑集中学习的框架方式解决多AGV的路径规划与冲突协调的问题,同时,规避了通信协议的引入,避免了通信延迟所带来的弊端。
-