-
公开(公告)号:CN119417169A
公开(公告)日:2025-02-11
申请号:CN202411556169.5
申请日:2024-11-04
Applicant: 北京信息科技大学
IPC: G06Q10/0631 , G06Q10/047 , G06N20/00 , G06N5/01 , G06N3/092 , G06N3/084 , G06N3/0464
Abstract: 本发明涉及电子组件车间AGV物流调度领域,公开了一种电子组件车间AGV复合作业模式下的改进PPO调度方法、系统、介质及设备,其包括:利用栅格建模对车间环境地图进行栅格化,通过多个任务订单使AGV在栅格地图进行A*搜索算法,获取批量的样本数据,根据样本预训练策略网络的模型参数,完成预训练;根据新的任务订单,AGV与环境进行交互,获取观测状态、动作空间和奖励值,将观测状态进行矩阵化处理后,作为PPO算法的输入数据,计算PPO算法的策略网络和价值网络损失值,并通过梯度下降法更新网络模型参数,完成PPO训练;在线生成实时任务订单,通过前两个阶段训练好的决策网络模型指导AGV完成路径规划和调度任务。本发明能快速学习获得电子组件车间AGV调度策略,学习效率显著提升并兼具稳定性。