-
公开(公告)号:CN119105496A
公开(公告)日:2024-12-10
申请号:CN202411220115.1
申请日:2024-09-02
Applicant: 长安大学
Abstract: 本发明提供了一种自动驾驶货运编队协同决策方法、装置、设备及存储介质。具体而言,本发明提出了一种定制的部分可观测马尔科夫决策过程(POMDP)模型,该模型针对高速公路场景下的货运编队协同决策,利用交错结构的编队控制方法增强货运编队在训练阶段的感知信息,进一步提升智能体决策网络在测试阶段的效果。进一步地,结合QMIX算法构建了一个基于中心化训练与去中心化执行(CTDE)训练范式的多智能体强化学习框架,对货运编队的安全性、通行效率及能耗目标进行优化,从而促使货运编队产生自发的协同行为。本发明与传统的货运编队控制方法相比,所提出的模型和框架在提升货运编队协同决策方面展现出了优越性能。