-
公开(公告)号:CN116524736B
公开(公告)日:2024-06-25
申请号:CN202310278110.3
申请日:2023-03-21
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于多任务思想下的深度强化学习交通灯控制方法,将平衡压力作为奖励函数构建深度强化学习框架,对交通信号灯进行智能调控。与以往信号灯控制的方法不同的是,本发明保留了以往方法的优越性,增强了相邻路口之间的互相协作,更是在最大压力概念的基础上更科学地平衡了各条出车道上的压力,从而更好地缓解了交通拥堵的情况,推进了智能交通的发展;本发明提出的一个交通灯控制算法TaskLight,它引用了多任务学习的思想,引入一种噪声机制并引入到了多任务学习框架,以此来权衡不同时间段每个任务的重要性程度。对于中心路口的效果更佳,对于缓解市中心路段的交通拥堵具有重要的现实意义。
-
公开(公告)号:CN116524736A
公开(公告)日:2023-08-01
申请号:CN202310278110.3
申请日:2023-03-21
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于多任务思想下的深度强化学习交通灯控制方法,将平衡压力作为奖励函数构建深度强化学习框架,对交通信号灯进行智能调控。与以往信号灯控制的方法不同的是,本发明保留了以往方法的优越性,增强了相邻路口之间的互相协作,更是在最大压力概念的基础上更科学地平衡了各条出车道上的压力,从而更好地缓解了交通拥堵的情况,推进了智能交通的发展;本发明提出的一个交通灯控制算法TaskLight,它引用了多任务学习的思想,引入一种噪声机制并引入到了多任务学习框架,以此来权衡不同时间段每个任务的重要性程度。对于中心路口的效果更佳,对于缓解市中心路段的交通拥堵具有重要的现实意义。
-
公开(公告)号:CN116185595A
公开(公告)日:2023-05-30
申请号:CN202310274087.0
申请日:2023-03-21
Applicant: 南京信息工程大学
IPC: G06F9/48 , G06F18/214 , G06N20/00 , G06N3/08
Abstract: 本发明公开了一种基于目标导向的深度强化学习中优先经验回放方法,步骤如下:对gym mountain_carv0的数据进行预处理;根据智能体小车在不同状态下与目标状态下的差异作为目标导向因子;利用DQN算法构建深度强化学习框架;根据行为值函数的TD‑error去量化经验的优先级的第一部分;将目标导向因子加入到优先级定义中成为优先级的第二部分,不断对整个网络进行更新,以求得到更好的结果。本发明保留了以往优先经验回放的优越性,也科学地完善了优先级的重新定义,对优先级的定义具有重要的参考意义;本发明提出的目标导向因子α,对于不同状态之间进行了合理的量化,对于经验回放中的优先级具有重要的研究意义。
-
-