多路口交通信号灯协同控制方法、设备及可读存储介质

    公开(公告)号:CN118629234B

    公开(公告)日:2024-12-13

    申请号:CN202410643565.5

    申请日:2024-05-23

    Inventor: 许鋆 罗芷悦

    Abstract: 本发明涉及多路口交通信号灯协同控制方法及设备、可读存储介质。其方法包括:获取交通流信息,输入到基于多智能体强化学习算法的交通信号灯控制模型中,以获得并存储每个智能体的状态、动作和奖励函数;采用基于高效链接神经网络的可解释影响机制,求出不同交通路网上输入数据的重要性系数,并求出加权聚合后的交通流隐变量;采用偏置ReLU神经网络逼近actor‑critic强化学习算法中的价值函数和策略函数,以构造分片线性actor‑critic的框架;采用集中式训练分布式执行的方法,每个智能体的actor通过交通流信息训练得到各自的策略函数;集中式critic根据交通流隐变量,训练得到一个联合价值函数,获得多智能体强化学习算法的最优解。本发明可提高道路交通流的效率和安全性。

    多路口交通信号灯协同控制方法、设备及可读存储介质

    公开(公告)号:CN118629234A

    公开(公告)日:2024-09-10

    申请号:CN202410643565.5

    申请日:2024-05-23

    Inventor: 许鋆 罗芷悦

    Abstract: 本发明涉及多路口交通信号灯协同控制方法、设备及可读存储介质。其方法包括:获取交通流信息,输入到基于多智能体强化学习算法的交通信号灯控制模型中,以获得并存储每个智能体的状态、动作和奖励函数;采用基于高效链接神经网络的可解释影响机制,求出不同交通路网上输入数据的重要性系数,并求出加权聚合后的交通流隐变量;采用偏置ReLU神经网络逼近actor‑critic强化学习算法中的价值函数和策略函数,以构造分片线性actor‑critic的框架;采用集中式训练分布式执行的方法,每个智能体的actor通过交通流信息训练得到各自的策略函数;集中式critic根据交通流隐变量,训练得到一个联合价值函数,获得多智能体强化学习算法的最优解。本发明可提高道路交通流的效率和安全性。

Patent Agency Ranking