基于深度强化学习算法的多车道场景集成式节能驾驶策略优化方法

    公开(公告)号:CN118707849A

    公开(公告)日:2024-09-27

    申请号:CN202410738317.9

    申请日:2024-06-07

    Applicant: 东南大学

    Abstract: 本发明涉及一种基于深度强化学习算法的多车道场景集成式节能驾驶策略优化方法,包括:以多车道直线高速公路为目标场景,利用不同算法分别控制主车和周围车辆的横纵向运动,建立运动学模型,并输入训练场景相关参数;从状态空间、动作空间和奖励函数三个方面,基于SAC算法设计轨迹规划与能量管理集成式节能驾驶策略;确定对协同优化性能影响最大的权重系数的合适取值,对设计策略的最优性和适应性进行检验。与现有技术相比,本发明中基于SAC算法的节能驾驶策略在与不同算法的最优性对比试验中展现了最优的性能,不仅比在线策略型深度强化学习算法更优,与同为离线型算法的DDPG和TD3相比,其综合性能也更强。

    基于双层注意力机制和离散SAC算法的无信号交叉口左转控制方法

    公开(公告)号:CN119806134A

    公开(公告)日:2025-04-11

    申请号:CN202411790408.3

    申请日:2024-12-06

    Applicant: 东南大学

    Abstract: 本发明涉及一种基于双层注意力机制和离散SAC算法的无信号交叉口左转控制方法,包括:步骤S1:构建仿真模型,其中,所述仿真模型包括路口仿真环境、自车模型和他车模型,并建立自车模型和他车模型与路口仿真环境的数据交互;步骤S2:将自车模型的轨迹规划过程定义为马尔可夫决策过程,构建第一模型,并配置状态空间、动作空间和奖励,其中,所述状态空间中的参数基于仿真模型获取;步骤S3:构建极大化熵目标函数,并选择极大化熵目标函数值最大的策略作为进行左转控制。与现有技术相比,本发明提高了29%的交叉口安全性,并在时空轨迹上显示了有效的避障能力。

Patent Agency Ranking