基于强化学习的增强高铁自动驾驶控制系统准时性的方法

    公开(公告)号:CN116859731A

    公开(公告)日:2023-10-10

    申请号:CN202310804271.1

    申请日:2023-07-03

    Abstract: 本发明提供一种基于强化学习的增强高铁自动驾驶控制系统准时性的方法,通过建立基本数据模块和列车运行仿真模块,设置奖励函数和额外单步奖励,设计神经网络结构,构建高速列车自动驾驶训练模型;确定训练参数执行训练,得到高速列车自动驾驶控制模型;本发明改进列车准时性奖励函数的设置方式,在保留原有全局奖励方法的基础上,设置一个在一轮训练过程中的每个单步中都能给予智能体准时性反馈的额外奖励函数,使奖励函数的引导性更强,解决准时性稀疏奖励难以获得的问题,提高列车自动驾驶控制系统的训练效率,更好地满足自动驾驶列车运行过程中的准时性要求。

    基于数字孪生的高速智能动车组自动驾驶能力测试方法

    公开(公告)号:CN118261041A

    公开(公告)日:2024-06-28

    申请号:CN202410341050.X

    申请日:2024-03-25

    Abstract: 本发明提供一种基于数字孪生的高速智能动车组自动驾驶能力测试方法,包括S1:通过对原始道路信息和动车信息处理,构建虚拟场景库和虚拟动车模型,建立数字孪生仿真测试场景;S2:用实地测试配合虚拟实验测试,完成动车闭环测试;S3:结合可视化动车运行信息对测试结果进行评价分析。本发明基于真实交通数据构建多元环境特征数字化场景库,采用了评价分析与交互模块,可以收集与储存高速智能动车舒适度、节能性、准时性、停车精度等关键指标的相关影响参数。本发明在数字孪生虚拟环境中布置两个动车模型,一个基于自动驾驶算法更新动车姿态信息,另一个动车模型通过真实动车的运动映射更新动车姿态信息,由此来实现对未来状态预测与在线更新并行测试。

    基于多维奖励Q学习的模型预测加权因子动态调整方法

    公开(公告)号:CN115167134B

    公开(公告)日:2024-10-25

    申请号:CN202210846015.4

    申请日:2022-07-19

    Applicant: 燕山大学

    Abstract: 本发明涉及一种基于多维奖励Q学习的模型预测加权因子动态调整方法,属于自动驾驶车辆轨迹跟踪控制领域。解决了采用模型预测控制原理设计轨迹跟踪控制器时对加权因子的选取不当会降低自动驾驶车辆轨迹跟踪稳定性和精确性以及行驶安全性的问题。本发明通过强化学习中Q学习方法,训练了加权因子最优调整策略,可实时动态调整模型预测轨迹跟踪控制器的加权因子,从而实时优化自动驾驶车辆的轨迹跟踪性能,以减少在每个采样时刻下车辆实际位置与预期轨迹之间的误差,提高自动驾驶车辆的轨迹跟踪精度和行驶稳定性、舒适性。

Patent Agency Ranking