基于多智能体联邦强化学习的时效优化方法

    公开(公告)号:CN118278544B

    公开(公告)日:2024-09-20

    申请号:CN202410535066.4

    申请日:2024-04-30

    摘要: 本发明公开了基于多智能体联邦强化学习的时效优化方法,包括以下步骤:S1、车辆ci进入路侧单元RSU覆盖范围后,从路侧单元RSU下载最新的强化学习模型;S2、对强化学习模型进行本地训练;S3、采用图神经网络GNN捕捉车辆之间的关系得到GNN模型,并对GNN模型进行局部聚合;S4、车辆ci行驶出路侧单元RSU覆盖范围之前,将训练的最新的本地模型上传到路侧单元RSU;S5、路侧单元RSU在接收到所有即将离开其覆盖范围的车辆的本地模型后,路侧单元RSU执行异步的联邦聚合得到全局模型;S6、路侧单元RSU将更新的全局模型发送给新进入路侧单元RSU覆盖区域内的所有车辆,以进行每一辆车的训练。提升了整个系统的运行效率,同时解决了车辆信息泄露的问题。

    基于多智能体联邦强化学习的时效优化方法

    公开(公告)号:CN118278544A

    公开(公告)日:2024-07-02

    申请号:CN202410535066.4

    申请日:2024-04-30

    摘要: 本发明公开了基于多智能体联邦强化学习的时效优化方法,包括以下步骤:S1、车辆ci进入路侧单元RSU覆盖范围后,从路侧单元RSU下载最新的强化学习模型;S2、对强化学习模型进行本地训练;S3、采用图神经网络GNN捕捉车辆之间的关系得到GNN模型,并对GNN模型进行局部聚合;S4、车辆ci行驶出路侧单元RSU覆盖范围之前,将训练的最新的本地模型上传到路侧单元RSU;S5、路侧单元RSU在接收到所有即将离开其覆盖范围的车辆的本地模型后,路侧单元RSU执行异步的联邦聚合得到全局模型;S6、路侧单元RSU将更新的全局模型发送给新进入路侧单元RSU覆盖区域内的所有车辆,以进行每一辆车的训练。提升了整个系统的运行效率,同时解决了车辆信息泄露的问题。