基于随机策略梯度的交通信号控制方法、系统及电子设备

    公开(公告)号:CN112614343A

    公开(公告)日:2021-04-06

    申请号:CN202011459044.2

    申请日:2020-12-11

    Abstract: 本发明公开了基于随机策略梯度的交通信号控制方法、系统及电子设备,该方法包括:获取至少一个控制信号交叉口的静态路网数据;根据静态路网数据可视化绘制交通仿真路网;获取至少一个控制信号交叉口的实时交通运行状态数据;根据交通运行状态数据对交通仿真路网中的仿真参数进行参数校核,得到优化后的交通仿真路网;将观测优化后的交通仿真路网得到的交通状态输入价值网络,得到交通状态下每个信号控制方案的评价值;将交通状态输入策略网络,得到每个信号控制方案的概率值;基于交通状态下每个信号控制方案的评价值以及一个信号控制方案,通过随机策略梯度更新策略网络的参数。本发明提供的方法,能够解决信号控制具有的维数爆炸的问题。

    基于随机策略梯度的交通信号控制方法、系统及电子设备

    公开(公告)号:CN112614343B

    公开(公告)日:2022-08-19

    申请号:CN202011459044.2

    申请日:2020-12-11

    Abstract: 本发明公开了基于随机策略梯度的交通信号控制方法、系统及电子设备,该方法包括:获取至少一个控制信号交叉口的静态路网数据;根据静态路网数据可视化绘制交通仿真路网;获取至少一个控制信号交叉口的实时交通运行状态数据;根据交通运行状态数据对交通仿真路网中的仿真参数进行参数校核,得到优化后的交通仿真路网;将观测优化后的交通仿真路网得到的交通状态输入价值网络,得到交通状态下每个信号控制方案的评价值;将交通状态输入策略网络,得到每个信号控制方案的概率值;基于交通状态下每个信号控制方案的评价值以及一个信号控制方案,通过随机策略梯度更新策略网络的参数。本发明提供的方法,能够解决信号控制具有的维数爆炸的问题。

Patent Agency Ranking