-
公开(公告)号:CN110322017A
公开(公告)日:2019-10-11
申请号:CN201910743104.4
申请日:2019-08-13
Applicant: 吉林大学
Abstract: 本发明公开了一种基于深度强化学习的自动驾驶智能车轨迹跟踪控制策略,针对智能车自动驾驶任务,根据深度确定性策略梯度(DDPG)算法中的“动作-评论家”结构,采用“双动作”网络分别输出方向盘转角命令和车速命令,并设计“主评论家”网络用以指导“双动作”网络的更新过程,具体包括:将自动驾驶任务描述为马尔可夫决策过程:<st,at,Rt,st+1>;采用行为克隆算法对改进DDPG算法中的“双动作”网络进行初始化;对深度强化学习DDPG算法中的“评论家”网络进行预训练;设计包含多种驾驶场景的训练道路进行强化学习在线训练;设置新的道路对训练好的深度强化学习(DRL)模型进行测试。本发明通过模仿人学车过程设计控制策略,实现了智能车在简单道路环境下的自动驾驶。
-
公开(公告)号:CN112906134B
公开(公告)日:2022-05-17
申请号:CN202110242649.4
申请日:2021-03-05
Applicant: 吉林大学
IPC: G06F30/15 , G06F30/20 , B60T17/22 , B60T8/1755 , G06F119/14
Abstract: 本发明公开了一种考虑制动执行器故障的自动驾驶车辆容错控制策略设计方法。针对电子液压制动系统,通过轮缸压力传感器采集轮缸真实压力与期望压力做为输入建立广义的制动系统故障模型。基于该模型,提出针对EHB系统典型的综合故障模型。同时通过该模型,计算出用于控制器设计的综合故障因子。在此基础上,结合鲁棒LPV/H∞控制理论,将故障因子作为时变调度参数设计实现上层鲁棒容错控制器的设计。最后,综合考虑各个制动执行器的故障程度,设计下层制动力矩分配算法,实现下层四个轮的制动力分配。本发明通过对EHB系统进行故障建模,将其中的故障因子作为调度参数,结合鲁棒理论设计控制器,实现容错控制,保证了自动驾驶车辆行驶过程中的稳定安全。
-
公开(公告)号:CN112906134A
公开(公告)日:2021-06-04
申请号:CN202110242649.4
申请日:2021-03-05
Applicant: 吉林大学
IPC: G06F30/15 , G06F30/20 , B60T17/22 , B60T8/1755 , G06F119/14
Abstract: 本发明公开了一种考虑制动执行器故障的自动驾驶车辆容错控制策略设计方法。针对电子液压制动系统,通过轮缸压力传感器采集轮缸真实压力与期望压力做为输入建立广义的制动系统故障模型。基于该模型,提出针对EHB系统典型的综合故障模型。同时通过该模型,计算出用于控制器设计的综合故障因子。在此基础上,结合鲁棒LPV/H∞控制理论,将故障因子作为时变调度参数设计实现上层鲁棒容错控制器的设计。最后,综合考虑各个制动执行器的故障程度,设计下层制动力矩分配算法,实现下层四个轮的制动力分配。本发明通过对EHB系统进行故障建模,将其中的故障因子作为调度参数,结合鲁棒理论设计控制器,实现容错控制,保证了自动驾驶车辆行驶过程中的稳定安全。
-
-