-
公开(公告)号:CN117032134A
公开(公告)日:2023-11-10
申请号:CN202311099265.7
申请日:2023-08-29
Applicant: 西安交通大学
IPC: G05B19/418
Abstract: 本发明公开了一种基于近似同步估计的多AGV调度策略评估与优化方法及系统,方法包括:构建多AGV共享的策略模型与联合策略评估模型;基于多AGV共享的策略模型与联合策略评估模型,令AGV与环境交互产生训练样本,计算边缘优势函数;根据AGV策略的不确定性,计算更新幅度截断量;在任意环境状态下,根据所述边缘优势函数替代联合优势函数,结合近端策略优化算法,将所述梯度截断量作为策略比值裁剪区间,对每个AGV的策略进行单独优化,直到多AGV调度策略完成优化。该方法能够在AGV调度任务中实现平稳、准确的策略评估,提升训练的稳定性及调度效率。