-
公开(公告)号:CN112598309A
公开(公告)日:2021-04-02
申请号:CN202011597378.6
申请日:2020-12-29
Applicant: 浙江工业大学
Abstract: 基于Keras的作业车间调度方法,包括:(1)定义作业车间调度问题;(2)构建网络模型;(3)加载作业车间调度问题的DQN类。本发明融合了神经网络和Q学习的方法来对作业车间调度问题进行优化。将作业车间调度在实际应用中状态和动作当作神经网络的输入,然后经过神经网络分析后得到动作的Q值,可以极大的优化计算机内存,且可以使原本更加复杂的问题变得简单。深度Q学习算法的经验回放机制,可以将智能体于环境交互产生的经验数据依次存储到固定大小的经验池中,算法每次迭代时从经验池中随机抽取一个小批量的数据来学习,这种从经验池中随机抽取数据的方式打破了原本序列数据的强相关性,提高了算法的稳定性,并且提高了数据的利用效率。
-
公开(公告)号:CN112598309B
公开(公告)日:2022-04-19
申请号:CN202011597378.6
申请日:2020-12-29
Applicant: 浙江工业大学
Abstract: 基于Keras的作业车间调度方法,包括:(1)定义作业车间调度问题;(2)构建网络模型;(3)加载作业车间调度问题的DQN类。本发明融合了神经网络和Q学习的方法来对作业车间调度问题进行优化。将作业车间调度在实际应用中状态和动作当作神经网络的输入,然后经过神经网络分析后得到动作的Q值,可以极大的优化计算机内存,且可以使原本更加复杂的问题变得简单。深度Q学习算法的经验回放机制,可以将智能体于环境交互产生的经验数据依次存储到固定大小的经验池中,算法每次迭代时从经验池中随机抽取一个小批量的数据来学习,这种从经验池中随机抽取数据的方式打破了原本序列数据的强相关性,提高了算法的稳定性,并且提高了数据的利用效率。
-