-
公开(公告)号:CN110956311A
公开(公告)日:2020-04-03
申请号:CN201911116073.6
申请日:2019-11-15
Applicant: 浙江工业大学
Abstract: 一种基于强化学习的超启发算法的车辆路径优化方法,包括以下步骤:步骤1车辆路径问题分析;步骤2初始化;步骤3经验池、序列池存储;步骤4解的接受保留;步骤5判断经验池容量,容量足够则进入步骤8学习,未满,则进入步骤6;步骤6选择Action;步骤7保留最优解;步骤8选择学习样本,并初始化神经网络;步骤9神经网络学习更新;步骤10更新目标值网络;步骤11判断学习结束情况,学习未结束,则进入步骤8继续学习更新;反之,则进入步骤6选择Action,返回主循环;步骤12程序结束,输出车辆路径距离最优值及最优值路径序列。本发明提供了一种高层选择策略为强化学习的超启发算法的车辆路径优化方法。
-
公开(公告)号:CN110956311B
公开(公告)日:2023-04-07
申请号:CN201911116073.6
申请日:2019-11-15
Applicant: 浙江工业大学
IPC: G06Q10/047 , G06N3/006 , G06Q10/0835
Abstract: 一种基于强化学习的超启发算法的车辆路径优化方法,包括以下步骤:步骤1车辆路径问题分析;步骤2初始化;步骤3经验池、序列池存储;步骤4解的接受保留;步骤5判断经验池容量,容量足够则进入步骤8学习,未满,则进入步骤6;步骤6选择Action;步骤7保留最优解;步骤8选择学习样本,并初始化神经网络;步骤9神经网络学习更新;步骤10更新目标值网络;步骤11判断学习结束情况,学习未结束,则进入步骤8继续学习更新;反之,则进入步骤6选择Action,返回主循环;步骤12程序结束,输出车辆路径距离最优值及最优值路径序列。本发明提供了一种高层选择策略为强化学习的超启发算法的车辆路径优化方法。
-
公开(公告)号:CN115271163A
公开(公告)日:2022-11-01
申请号:CN202210692264.2
申请日:2022-06-17
Applicant: 浙江工业大学
Abstract: 一种基于策略梯度的超启发算法的车辆路径优化方法,包括车辆路径问题的研究背景意义及技术,包括:步骤1有容量车辆路径问题分析;步骤2参数初始化;步骤3初始化种群;步骤4通过算子选择机制选择算子对种群进行操作,并计算相关信息并存储于经验池中;步骤5判断算法迭代的次数,若达到预设步距,则进入步骤6学习,反之,则进入步骤4;步骤6从经验池中选择状态转移数据对策略梯度算法中的神经网络进行训练;步骤7判断是否达到算法终止运行条件,若是,则输出最优解;反之则返回主循环。本发明提供了一种高层选择策略为策略梯度的超启发算法的车辆路径优化方法。
-
-