-
公开(公告)号:CN112949933A
公开(公告)日:2021-06-11
申请号:CN202110305534.5
申请日:2021-03-23
Applicant: 成都信息工程大学 , 四川易方智慧科技有限公司
Abstract: 本发明公开了一种基于多智能体强化学习的交通组织方案优化方法,改进了MADDPG中的Actor网络,基于生灭过程改进了Critic网络中的经验库,使用早高峰最大车流设作为智能体回报指标,使用轨迹数据训练最大熵逆强化学习模型作为多智能体的回报机制,基于此设计出强化学习的回报函数;本发明方法实现了对当前城市交通组织方案进行优化,通过对当前交通数据进行分析,找出导致交通拥堵的原因,本方法能够很好的适应和快速找出最优方案,为交警专家提供了交通辅导意见,并为智慧城市打下基础。
-
公开(公告)号:CN113628442B
公开(公告)日:2022-10-14
申请号:CN202110911165.4
申请日:2021-08-06
Applicant: 成都信息工程大学
Abstract: 本发明公开了一种基于多信号灯强化学习的交通组织方案优化方法,属于交通信号灯控制领域。首先构造包含状态空间集和行为空间集的Actor网络,再将观察值传入,经过Subnet网络的处理将高纬度信息压缩成低纬度信息,进行行为偏转概率的计算,然后将初始状态信息、更新后的状态信息、行为偏转概率传入Critic网络中进行集中式学习,最近进行轨迹重构。在多路口交通环境下,多智能体借助Actor‑Critic算法框架,提高了路网畅通率。同时使用了智能体之间集中式学习分散式执行的方法,结合了集中式学习和分散式执行的优点,使得算法在收敛速度上得到了较大的提升。
-
公开(公告)号:CN112949933B
公开(公告)日:2022-08-02
申请号:CN202110305534.5
申请日:2021-03-23
Applicant: 成都信息工程大学 , 四川易方智慧科技有限公司
Abstract: 本发明公开了一种基于多智能体强化学习的交通组织方案优化方法,改进了MADDPG中的Actor网络,基于生灭过程改进了Critic网络中的经验库,使用早高峰最大车流设作为智能体回报指标,使用轨迹数据训练最大熵逆强化学习模型作为多智能体的回报机制,基于此设计出强化学习的回报函数;本发明方法实现了对当前城市交通组织方案进行优化,通过对当前交通数据进行分析,找出导致交通拥堵的原因,本方法能够很好的适应和快速找出最优方案,为交警专家提供了交通辅导意见,并为智慧城市打下基础。
-
公开(公告)号:CN113628442A
公开(公告)日:2021-11-09
申请号:CN202110911165.4
申请日:2021-08-06
Applicant: 成都信息工程大学
Abstract: 本发明公开了一种基于多信号灯强化学习的交通组织方案优化方法,属于交通信号灯控制领域。首先构造包含状态空间集和行为空间集的Actor网络,再将观察值传入,经过Subnet网络的处理将高纬度信息压缩成低纬度信息,进行行为偏转概率的计算,然后将初始状态信息、更新后的状态信息、行为偏转概率传入Critic网络中进行集中式学习,最近进行轨迹重构。在多路口交通环境下,多智能体借助Actor‑Critic算法框架,提高了路网畅通率。同时使用了智能体之间集中式学习分散式执行的方法,结合了集中式学习和分散式执行的优点,使得算法在收敛速度上得到了较大的提升。
-
公开(公告)号:CN110928974A
公开(公告)日:2020-03-27
申请号:CN201911216390.5
申请日:2019-12-02
Applicant: 成都信息工程大学
IPC: G06F16/29 , G06F40/151 , G06F40/126 , G08G1/01
Abstract: 本发明涉及道路网简化领域,目的是提供基于Kml生成及融点简化路网的方法,本发明包括以下步骤:S1:获取待研究地区的道路经纬度数据和路口的经纬度数据;S2:将S1中的经纬度作为输入,通过getRoadNet函数转换得到所述待研究地区的道路拓扑结构文件和路口信息文件;S3:通过整合所述道路拓扑结构文件和所述路口信息文件,得到简化后的kml文件;S4:将S3中简化后的Kml文件重新跟所述待研究地区的道路进行匹配,并进行编码得到待研究地区的道路结构图,本方法设计合理,实用性强,适合推广。
-
-
-
-