-
公开(公告)号:CN119568156A
公开(公告)日:2025-03-07
申请号:CN202411790405.X
申请日:2024-12-06
Applicant: 东南大学
Abstract: 本发明涉及一种个性化的自动变道和速度控制驾驶协同决策方法,包括:步骤S1:构建个性化决策分层框架;步骤S2:搭建换道决策训练网络,确定换道决策的优化目标,同时引入动作屏蔽机制消除危险动作的安全隐患,设定训练所需的上层状态空间、动作空间和换道奖励函数,并赋予换道奖励函数个性化权重;步骤S3:搭建跟驰决策训练网络,确定跟驰决策的优化目标,同时将优化目标定量化为奖励系数,并设定训练所需的下层状态空间、动作空间和跟驰奖励函数,并赋予跟驰奖励函数个性化权重;步骤S4:采用协同决策方法并进行换道决策训练网络和跟驰决策训练网络的耦合训练,并搭建风格奖励优先体验回放来丰富经验回放优先级度量。与现有技术相比,本发明具有提高车辆的安全性和行驶效率等优点。
-
公开(公告)号:CN117436342A
公开(公告)日:2024-01-23
申请号:CN202311472229.0
申请日:2023-11-07
Applicant: 东南大学
IPC: G06F30/27 , G06N3/04 , G06N3/092 , G06F119/04 , G06F119/14
Abstract: 本发明涉及一种燃料电池汽车高耐久节能驾驶策略构建方法,包括:构建训练的仿真环境,输入标准驾驶循环下的车辆行驶数据,用作ACC的跟驰场景中领航车的训练数据;创建Actor网络、Critic网络以及目标Critic网络,以构建节能驾驶的训练网络,建立节能驾驶的优化目标,同时将优化目标定量化为奖励系数,并设定训练所需的状态空间、动作空间和奖励函数;对节能驾驶策略进行离线训练,获得可继承的参数化神经网络策略;将离线训练得到的参数化神经网络策略下载到燃料电池混合动力汽车的整车控制器中。与现有技术相比,本发明实现多目标优化;有效延缓车辆部件衰退;在维持电动化部件高耐久和安全舒适驾驶体验的同时,提高能源利用效率,降低综合成本。
-