-
公开(公告)号:CN115731007A
公开(公告)日:2023-03-03
申请号:CN202211580746.5
申请日:2022-12-09
Applicant: 南京邮电大学
IPC: G06Q30/0601 , G06Q10/0631 , G06Q10/083
Abstract: 一种面向区域协同的强化学习实时订单派送方法,基于区域栏栅化处理构建空间地理信息;对空间位置价值信息进行编码,获取对应特征向量矩阵;结合订单分配矩阵和订单接受率因素,计算单个区域内的效益度指标;将子区域按流量权重分配计算总效益度指标,并确定因素限制条件集合;根据优化目标函数和约束条件提出约束优化方程组,通过拉格朗日乘子将求解约束优化问题转化成无约束优化问题;使用总效益度指标作为深度强化学习奖惩值;通过环境交互优化参数,进而获取训练好后的实时派单模型。本方法可以显著提高快递派单系统实时响应速度,有助于解决区域协同的智能派单效益最大化问题。