一种基于深度强化学习的仓储物流调度方法

    公开(公告)号:CN118552097A

    公开(公告)日:2024-08-27

    申请号:CN202410505795.5

    申请日:2024-04-25

    Abstract: 本发明公开了一种基于深度强化学习的仓储物流调度方法,包括调度数据集构建、深度神经网络模型构建和训练以及运输路径生成。深度神经网络包括指针网络和图神经网络,分别用与输出运输点概率向量和热图向量,且根据运输点概率向量与二维坐标距离长度构建第一奖惩值、根据热图向量与目标二维热图向量的交叉熵构建第二奖惩值;将两个奖惩值应用到损失函数中进行反向传播。所述运输路径生成利用旅行商问题的局部最优性,通过交换运输点位置,有效解决最优运输路径中相邻运输点在现有神经网络方法得到的运输路径中可能相隔很远的问题。

Patent Agency Ranking