-
公开(公告)号:CN115495997B
公开(公告)日:2024-01-30
申请号:CN202211334615.9
申请日:2022-10-28
Applicant: 东南大学
IPC: G06F30/27 , B60W50/00 , G06N3/04 , G06N3/092 , G06F119/08 , G06F119/14
Abstract: 本。本发明公开了一种基于异构多智能体深度强化学习的新能源汽车生态驾驶方法,针对串联式新能源汽车,基于多智能体深度确定性策略梯度算法,融合自适应巡航控制(ACC)和能量管理策略(EMS),开发了一种集成式的生态驾驶框架。主要步骤包括构建仿真环境,加载训练数据;构建两个智能体ACC和EMS,并搭建Actor、Critic网络及目标网络;训练生态驾驶策略,获得可继承的网络参数;加载网络参数至整车控制器,实现在线应用。本方法利用两个异构智能体解耦并优化不同领域的目标,避免权重不协调的负面影(56)对比文件Jiankun Peng et al.CollaborativeOptimization of Energy ManagementStrategy and Adaptive Cruise ControlBased on Deep Reinforcement Learning.《IEEE Transactions on TransportationElectrification》.2022,参见第1-3节.
-
公开(公告)号:CN116461391A
公开(公告)日:2023-07-21
申请号:CN202310661463.1
申请日:2023-06-06
Applicant: 东南大学
Abstract: 本发明公开了一种燃料电池混动汽车能量管理方法,主要步骤包括构建仿真环境、构建训练工况和验证工况;搭建Actor、Critic网络及其目标网络;训练能量管理策略,获得可继承的网络参数;加载网络参数至整车控制器,实现在线应用。本方法采用了Beta策略来改进标准SAC算法来提高优化性能;经过多次仿真实验,确定了合适的权重系数,并强调了健康约束,以降低驾驶成本,延长燃料电池混动汽车(FCHEV)的使用寿命;实现了与动态规划(DP)基准非常接近的性能,并且在不同驾驶循环中的仿真结果表明了良好的适应性。
-
公开(公告)号:CN119806134A
公开(公告)日:2025-04-11
申请号:CN202411790408.3
申请日:2024-12-06
Applicant: 东南大学
IPC: G05D1/43 , G05D1/65 , G05D1/633 , G05D1/644 , G05D109/10
Abstract: 本发明涉及一种基于双层注意力机制和离散SAC算法的无信号交叉口左转控制方法,包括:步骤S1:构建仿真模型,其中,所述仿真模型包括路口仿真环境、自车模型和他车模型,并建立自车模型和他车模型与路口仿真环境的数据交互;步骤S2:将自车模型的轨迹规划过程定义为马尔可夫决策过程,构建第一模型,并配置状态空间、动作空间和奖励,其中,所述状态空间中的参数基于仿真模型获取;步骤S3:构建极大化熵目标函数,并选择极大化熵目标函数值最大的策略作为进行左转控制。与现有技术相比,本发明提高了29%的交叉口安全性,并在时空轨迹上显示了有效的避障能力。
-
公开(公告)号:CN118963124A
公开(公告)日:2024-11-15
申请号:CN202411026157.1
申请日:2024-07-30
Applicant: 东南大学
Abstract: 本发明公开了一种综合舒适性增强型网联燃料电池客车节能驾驶方法,以网联燃料电池客车为研究对象,利用IRI和WRMSA之间的相关性,将垂向舒适度和路面信息引入进节能驾驶策略;集成能量管理系统和自适应巡航控制,将协同优化目标量化成奖励系数,设定状态空间、动作空间和奖励函数,基于深度强化学习算法得到综合舒适性增强型节能驾驶策略;通过对节能驾驶策略进行离线训练,获得可继承的参数化神经网络策略,并下载到整车控制器中,实现节能驾驶策略的实时在线应用。本发明能够实现与动态规划相当的节能和舒适性水平,并大大提高计算效率以实时应用。本发明在保持车辆最优节能调节下的安全性、耐久性等指标的同时,增加了驾乘综合舒适性。
-
公开(公告)号:CN117436342A
公开(公告)日:2024-01-23
申请号:CN202311472229.0
申请日:2023-11-07
Applicant: 东南大学
IPC: G06F30/27 , G06N3/04 , G06N3/092 , G06F119/04 , G06F119/14
Abstract: 本发明涉及一种燃料电池汽车高耐久节能驾驶策略构建方法,包括:构建训练的仿真环境,输入标准驾驶循环下的车辆行驶数据,用作ACC的跟驰场景中领航车的训练数据;创建Actor网络、Critic网络以及目标Critic网络,以构建节能驾驶的训练网络,建立节能驾驶的优化目标,同时将优化目标定量化为奖励系数,并设定训练所需的状态空间、动作空间和奖励函数;对节能驾驶策略进行离线训练,获得可继承的参数化神经网络策略;将离线训练得到的参数化神经网络策略下载到燃料电池混合动力汽车的整车控制器中。与现有技术相比,本发明实现多目标优化;有效延缓车辆部件衰退;在维持电动化部件高耐久和安全舒适驾驶体验的同时,提高能源利用效率,降低综合成本。
-
公开(公告)号:CN115495997A
公开(公告)日:2022-12-20
申请号:CN202211334615.9
申请日:2022-10-28
Applicant: 东南大学
IPC: G06F30/27 , B60W50/00 , G06N3/04 , G06N3/08 , G06F119/08 , G06F119/14
Abstract: 本发明公开了一种基于异构多智能体深度强化学习的新能源汽车生态驾驶方法,针对串联式新能源汽车,基于多智能体深度确定性策略梯度算法,融合自适应巡航控制(ACC)和能量管理策略(EMS),开发了一种集成式的生态驾驶框架。主要步骤包括构建仿真环境,加载训练数据;构建两个智能体ACC和EMS,并搭建Actor、Critic网络及目标网络;训练生态驾驶策略,获得可继承的网络参数;加载网络参数至整车控制器,实现在线应用。本方法利用两个异构智能体解耦并优化不同领域的目标,避免权重不协调的负面影响;采用改进的优先经验回放技术,提高了算法的性能;对多种交通工况具有良好的适应性;在实现最佳跟驰性能的前提下降低了综合行驶成本。
-
-
-
-
-