-
公开(公告)号:CN113724507B
公开(公告)日:2024-01-23
申请号:CN202110955481.1
申请日:2021-08-19
Applicant: 复旦大学
Abstract: 本发明涉及一种基于深度强化学习的交通控制与车辆诱导协同方法和系统,方法包括:构建交通灯Agent和车辆Agent;根据交通灯Agent和车辆Agent,设定并初始化DQN算法模型,该DQN算法模型中的动作集包括车辆动作和交通灯动作;根据Q值表选取并执行各车辆Agent的动作,并在各车辆Agent的动作执行结束后,根据执行完毕的车辆Agent的反馈信息更新对应的Q值表;根据各车辆Agent的动作,对交通灯进行动态配时,以削减车辆平均等待时间为目标选择交通灯最优动作;判断各交通灯Agent所选动作是否结束,对所选动作执行完毕的交通灯Agent根据实时反馈信息来更新对应的Q值表;重复更新,直至满足预设的停止条件。与现有技术相比,本发明具有较好的感知和决策能力并且具有很好的适应性。
-
公开(公告)号:CN113724507A
公开(公告)日:2021-11-30
申请号:CN202110955481.1
申请日:2021-08-19
Applicant: 复旦大学
Abstract: 本发明涉及一种基于深度强化学习的交通控制与车辆诱导协同方法和系统,方法包括:构建交通灯Agent和车辆Agent;根据交通灯Agent和车辆Agent,设定并初始化DQN算法模型,该DQN算法模型中的动作集包括车辆动作和交通灯动作;根据Q值表选取并执行各车辆Agent的动作,并在各车辆Agent的动作执行结束后,根据执行完毕的车辆Agent的反馈信息更新对应的Q值表;根据各车辆Agent的动作,对交通灯进行动态配时,以削减车辆平均等待时间为目标选择交通灯最优动作;判断各交通灯Agent所选动作是否结束,对所选动作执行完毕的交通灯Agent根据实时反馈信息来更新对应的Q值表;重复更新,直至满足预设的停止条件。与现有技术相比,本发明具有较好的感知和决策能力并且具有很好的适应性。
-
公开(公告)号:CN113936475A
公开(公告)日:2022-01-14
申请号:CN202110955483.0
申请日:2021-08-19
Applicant: 复旦大学
Abstract: 本发明涉及一种多道路资源优化的交通控制方法和系统,方法包括以下步骤:通过传感器采集某一交叉口的车辆排队长度、车辆平均速度和车辆位置信息,从而计算当前交叉口的道路通行能力,构建以道路通行能力最大、平均延误最小的目标函数,计算预设的各个交叉口通行相位顺序的目标函数值,从而获取最优的交叉口通行相位顺序,作为下个周期该交叉口的交叉口通行相位顺序,所述平均延误根据交叉口通行相位顺序、车辆排队长度、车辆平均速度和车辆位置计算。与现有技术相比,本发明通过减少特定拥塞区域内的车辆输入来降低拥塞程度,从而从整体上解决交通拥塞的问题,改善路况,实现无人化和智慧化的交通管理。
-
-