-
公开(公告)号:CN116524736B
公开(公告)日:2024-06-25
申请号:CN202310278110.3
申请日:2023-03-21
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于多任务思想下的深度强化学习交通灯控制方法,将平衡压力作为奖励函数构建深度强化学习框架,对交通信号灯进行智能调控。与以往信号灯控制的方法不同的是,本发明保留了以往方法的优越性,增强了相邻路口之间的互相协作,更是在最大压力概念的基础上更科学地平衡了各条出车道上的压力,从而更好地缓解了交通拥堵的情况,推进了智能交通的发展;本发明提出的一个交通灯控制算法TaskLight,它引用了多任务学习的思想,引入一种噪声机制并引入到了多任务学习框架,以此来权衡不同时间段每个任务的重要性程度。对于中心路口的效果更佳,对于缓解市中心路段的交通拥堵具有重要的现实意义。
-
公开(公告)号:CN114613169B
公开(公告)日:2023-02-28
申请号:CN202210415387.1
申请日:2022-04-20
Applicant: 南京信息工程大学
IPC: G08G1/08 , G08G1/01 , G06N3/047 , G06N3/0442 , G06N3/08
Abstract: 本发明公开了一种基于双经验池DQN的交通信号灯控制方法,包括:1、建立基于DQN算法的交通信号灯控制主网络和目标值网络;2、初始化算法相关参数,采集交通路口的路况信息,建立状态值st;3、将st输入主网络中,选择Q值最大值的动作at;4、执行at并计算奖励rt和状态st+1;将(st,at,rt,st+1)存储到第一经验池;5、如果奖励rt大于历史经验平均奖励将(st,at,rt,st+1)存储到第二经验池;6、生成随机数P,以概率1‑P选择第一经验池,以概率P选择第二经验池,在选中的经验池中随机抽样,通过最小化损失函数训练主网络的参数;S7、定时更新目标值网络的参数;根据当前路况信息更新st,跳转至步骤3继续执行。该方法能够使算法快速收敛,获得的交通信号灯控制策略快速优化。
-
公开(公告)号:CN113284030A
公开(公告)日:2021-08-20
申请号:CN202110719151.2
申请日:2021-06-28
Applicant: 南京信息工程大学
Inventor: 杨智超
Abstract: 本发明公开了一种城市交通网络社区划分方法,首先对城市内交通网络数据进行预处理,获得其交通网络无向图;然后,利用Louvain算法处理该交通网络图,使其初步划分为几个交通社区;再利用注意力机制处理位于社区边缘的节点,通过节点间的注意力系数判断其互相影响程度,并以此来验证社区划分是否合理;最后,对交通网络社区的划分进行可视化展示。本发明能够依据交通节点之间道路的状况以及交通节点之间的互相影响程度,快速地对城市交通网络进行社区的划分,有助于推进智能交通各个领域的研究,也有助于改善城市规划和交通管理,具有切实可行的实用价值。
-
公开(公告)号:CN117708594A
公开(公告)日:2024-03-15
申请号:CN202311717211.2
申请日:2023-12-13
Applicant: 南京信息工程大学
IPC: G06F18/214 , G06N3/092 , G08G1/08 , G08G1/081
Abstract: 本发明公开了一种深度强化学习交通灯控制方法,包括以下步骤:(1)对城市内交通网络数据进行预处理;(2)根据预处理后的数据利用Multi‑step DQN算法构建模型;(3)将n个单步的经验进行累加,再利用累加后的经验进行学习;(4)更新Multi‑step DQN的网络参数;(5)将Attentive experience replay与DQN网络相结合,构建深度强化学习模型;(6)将交通数据集、车流数据集导入深度强化学习模型,进行训练,并记录实验结果;(7)比较步骤(2)和步骤(5)中的实验结果;(8)进行可视化展示;本发明与传统控制方法相比,MALight在减少车辆的平均通行时间和提高路口的平均吞吐量做得更好。
-
公开(公告)号:CN113284030B
公开(公告)日:2023-05-23
申请号:CN202110719151.2
申请日:2021-06-28
Applicant: 南京信息工程大学
Inventor: 杨智超
IPC: G06Q50/26 , G06Q50/30 , G06Q10/0631
Abstract: 本发明公开了一种城市交通网络社区划分方法,首先对城市内交通网络数据进行预处理,获得其交通网络无向图;然后,利用Louvain算法处理该交通网络图,使其初步划分为几个交通社区;再利用注意力机制处理位于社区边缘的节点,通过节点间的注意力系数判断其互相影响程度,并以此来验证社区划分是否合理;最后,对交通网络社区的划分进行可视化展示。本发明能够依据交通节点之间道路的状况以及交通节点之间的互相影响程度,快速地对城市交通网络进行社区的划分,有助于推进智能交通各个领域的研究,也有助于改善城市规划和交通管理,具有切实可行的实用价值。
-
公开(公告)号:CN116524736A
公开(公告)日:2023-08-01
申请号:CN202310278110.3
申请日:2023-03-21
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于多任务思想下的深度强化学习交通灯控制方法,将平衡压力作为奖励函数构建深度强化学习框架,对交通信号灯进行智能调控。与以往信号灯控制的方法不同的是,本发明保留了以往方法的优越性,增强了相邻路口之间的互相协作,更是在最大压力概念的基础上更科学地平衡了各条出车道上的压力,从而更好地缓解了交通拥堵的情况,推进了智能交通的发展;本发明提出的一个交通灯控制算法TaskLight,它引用了多任务学习的思想,引入一种噪声机制并引入到了多任务学习框架,以此来权衡不同时间段每个任务的重要性程度。对于中心路口的效果更佳,对于缓解市中心路段的交通拥堵具有重要的现实意义。
-
公开(公告)号:CN114613169A
公开(公告)日:2022-06-10
申请号:CN202210415387.1
申请日:2022-04-20
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于双经验池DQN的交通信号灯控制方法,包括:1、建立基于DQN算法的交通信号灯控制主网络和目标值网络;2、初始化算法相关参数,采集交通路口的路况信息,建立状态值st;3、将st输入主网络中,选择Q值最大值的动作at;4、执行at并计算奖励rt和状态st+1;将(st,at,rt,st+1)存储到第一经验池;5、如果奖励rt大于历史经验平均奖励将(st,at,rt,st+1)存储到第二经验池;6、生成随机数P,以概率1‑P选择第一经验池,以概率P选择第二经验池,在选中的经验池中随机抽样,通过最小化损失函数训练主网络的参数;S7、定时更新目标值网络的参数;根据当前路况信息更新st,跳转至步骤3继续执行。该方法能够使算法快速收敛,获得的交通信号灯控制策略快速优化。
-
-
-
-
-
-