-
公开(公告)号:CN114707881A
公开(公告)日:2022-07-05
申请号:CN202210406935.4
申请日:2022-04-18
Applicant: 贵州大学
Abstract: 本发明公开了一种基于深度强化学习的作业车间自适应调度方法,在近端策略优化算法中设计优化的动作策略和异步更新机制,形成直接高效探索和异步更新近端策略优化算法,基于直接高效探索和异步更新近端策略优化算法,将图神经网络与原始状态信息的分层非线性细化相结合,设计了一种端到端的强化学习方法,基于此,获得一个自适应调度系统。本发明的直接高效探索和异步更新近端策略优化算法具有高级鲁棒性,调度得分比近端策略优化算法提高5.6%,最小完成时间比深度Q网络算法降低8.9%。实验结果证明了所提出的自适应调度策略的有效性和通用性。