一种依托强化学习的PID轨迹跟踪控制方法及装置

    公开(公告)号:CN119739151A

    公开(公告)日:2025-04-01

    申请号:CN202411674068.8

    申请日:2024-11-21

    Abstract: 本发明涉及自动驾驶领域,特别是指一种依托强化学习的PID轨迹跟踪控制方法及装置,方法包括:获取待控制自动驾驶车辆的当前状态、参考轨迹和实际运行误差;构建车辆轨迹跟踪控制的策略模型;将当前状态和参考轨迹输入至车辆轨迹跟踪控制的策略模型,得到PID控制参数;将PID控制参数和实际运行误差输入至PID控制器,得到自动驾驶车辆的控制量,根据自动驾驶车辆的控制量,完成自动驾驶车辆轨迹跟踪控制。本发明利用强化学习强大的学习能力结合PID本身的稳定性以及强鲁棒性,实现车辆轨迹跟踪控制的高实时、高稳定和高精度在线计算。解决当前车辆轨迹跟踪控制的计算实时性差、应用可靠性弱和依赖复杂动态模型等问题。

    一种面向工业对象的非线性系统高斯近似滤波方法

    公开(公告)号:CN119602750A

    公开(公告)日:2025-03-11

    申请号:CN202411648641.8

    申请日:2024-11-18

    Applicant: 清华大学

    Abstract: 本公开涉及计算机技术领域,包括一种面向工业对象的非线性系统高斯近似滤波方法。通过对待进行状态估计的物理系统进行数学建模,得到物理系统对应的非线性状态空间模型;基于非线性状态空间模型通过矩匹配操作,使时刻t的系统状态的第一高斯分布匹配给定分布,以确定时刻t的系统状态的预测估计和预测估计误差;获取时刻t的系统观测值;基于自然梯度下降法和与时刻t的系统状态的第二高斯分布相关联的Fisher信息矩阵,迭代更新时刻t的系统状态的最优估计和最优估计误差,直至满足迭代停止条件时,得到的时刻t的最优估计和最优估计误差;可以避免线性化误差,提供更精确的非线性系统的系统状态估计。

    一种面向自动驾驶汽车的约束型环境安全探索方法

    公开(公告)号:CN118964791A

    公开(公告)日:2024-11-15

    申请号:CN202410966744.2

    申请日:2024-07-18

    Applicant: 清华大学

    Abstract: 本申请提出了一种面向自动驾驶汽车的约束型环境安全探索方法,涉及自动驾驶技术领域,其中,该方法包括:步骤S1:获取初始的不确定模型;步骤S2:采用不动点迭代求解不确定模型下的最大可行区域;步骤S3:遍历最大可行区域内的所有状态动作对,通过与环境交互采集环境数据;步骤S4:利用最大可行区域内的环境数据,采用最大团搜索求解最大可行区域下的近似最小不确定模型,并将不确定模型更新为近似最小不确定模型;步骤S5:迭代进行步骤S2‑S4,直至最大可行区域和不确定模型不再更新,得到驾驶策略的最大可行区域。采用上述方案的本发明能够获取约束型环境中可安全探索的最大可行区域。

    自动驾驶感知模型功能模块的搭建方法及装置

    公开(公告)号:CN118674935A

    公开(公告)日:2024-09-20

    申请号:CN202410698668.1

    申请日:2024-05-31

    Applicant: 清华大学

    Abstract: 本申请涉及自动驾驶感知技术领域,特别涉及一种自动驾驶感知模型功能模块的搭建方法及装置,其中,方法包括:利用计算基础平台工作进行数据标注和BEV数据格式适配,生成车路云一体化感知系统功能模块库,以对不同功能模块进行选择组合,得到适用于目标任务的需求功能模块,以构建感知算法框架对至少一个功能模块进行测评,得到至少一个功能模块的特征可视化定性分析结果与评价指标定量分析结果;基于用户的自身个性化数据、特征可视化定性分析结果与评价指标定量分析结果和实际任务的数据对感知算法框架下的感知模型进行微调,搭建最终的自动驾驶感知模型。本申请可以实现独立功能模块的评价和测试,指导功能模块预训练和微调。

    一种城市道路机动车异常驾驶行为的建模方法

    公开(公告)号:CN118133536A

    公开(公告)日:2024-06-04

    申请号:CN202410247826.1

    申请日:2024-03-05

    Applicant: 清华大学

    Abstract: 本公开提供了一种城市道路机动车异常驾驶行为的建模方法,具体是基于人类的认知行为过程,模拟混合交通场景中多车道机动车与周围机动车的交互全过程,克服了现有技术中多车道场景中机动车交互场景单一、交互行为规则的问题,包括:S1根据当前交通流状态确定异常驾驶行为集,根据被试车的实时速度得到对应的异常驾驶行为子集;S2按照一定概率采样异常驾驶行为子集中的异常驾驶行为;S3根据对被试车进行采样得到异常驾驶行为的触发条件,选择符合触发条件的周车,作为待控周车;S4待控周车执行异常行为。本公开能够为自动驾驶仿真软件提供真实丰富、包括长尾场景的道路交通环境,满足自动驾驶汽车决策控制算法训练和测试的真实性需求。

    智能驾驶计算平台功能软件重构和可视化方法及装置

    公开(公告)号:CN118012495A

    公开(公告)日:2024-05-10

    申请号:CN202410032227.8

    申请日:2024-01-09

    Applicant: 清华大学

    Abstract: 本申请涉及一种智能驾驶计算平台功能软件重构和可视化方法及装置,其中,方法包括:按照预设分析顺序分析目标智能驾驶源代码的函数架构,得到函数树;重构目标智能驾驶源代码,得到目标计算机语言代码,并根据函数树、预设测试顺序等判断其与目标智能驾驶源代码和目标计算机语言代码的执行功能是否一致;当目标智能驾驶源代码和目标计算机语言代码的执行功能一致时,对目标计算机语言代码进行前端集成图形化处理,生成可视化目标计算机语言代码,并将其部署在相应硬件平台中。由此,解决了现有自动驾驶技术核心算法迁移到C++难度较大,且其开发效率、集成效率和验证效率较低;此外,当前行业缺乏统一标准,较难提炼共性技术赋能行业发展等问题。

    一种自动驾驶决策功能训练方法、系统及存储介质

    公开(公告)号:CN117521838A

    公开(公告)日:2024-02-06

    申请号:CN202210879625.4

    申请日:2022-07-25

    Abstract: 本发明提供了一种自动驾驶决策功能训练方法、系统及存储介质,上述方法包括:获取自动驾驶数据集,并在自动驾驶数据集中随机采样得到训练数据集;根据训练数据集以及设定的策略更新步数和策略参数计算得到随机梯度,并利用随机梯度计算得到无偏差的共轭动量;根据无偏差的共轭动量以及设定的策略参数学习率和速度因子,计算得到与策略参数对应的自适应学习率;基于无偏差的共轭动量和自适应学习率对所述策略参数进行更新;对所述策略更新步数进行迭代计算,在达到设定的最大策略更新步数的情况下,得到优化后的策略参数,以使自动驾驶决策功能训练系统采用优化后的策略参数进行自动驾驶决策,从而有效保障自动驾驶决策功能的智能性。

    一种自动驾驶汽车的显式控制律设计方法

    公开(公告)号:CN117389275A

    公开(公告)日:2024-01-12

    申请号:CN202311445655.5

    申请日:2023-11-02

    Applicant: 清华大学

    Abstract: 本申请涉及汽车智能驾驶技术领域,特别涉及一种自动驾驶汽车的显式控制律设计方法,其中,方法包括:构建具有仿射结构的车辆动力学模型;基于车辆动力学仿射模型,将跟踪避障约束型最优控制问题的目标函数与约束条件转换为控制李雅普诺夫函数与控制障碍函数;将控制李雅普诺夫函数与控制障碍函数进行加权相加,以构建控制李雅普诺夫‑障碍函数;利用控制李雅普诺夫‑障碍函数的梯度,动力学模型的状态转移矩阵和控制输入转移矩阵来设计控制自动驾驶汽车的显式控制律。由此,解决相关技术中,由于需要大规模迭代计算求解避障跟踪控制中约束型最优控制问题,面对多障碍物情况时,计算复杂度骤增,不能满足毫秒级的车载控制器实时性和安全性的问题。

    一种用于伊辛机的多层前馈神经网络训练方法

    公开(公告)号:CN117313819A

    公开(公告)日:2023-12-29

    申请号:CN202311379749.7

    申请日:2023-10-23

    Applicant: 清华大学

    Abstract: 本发明公开了一种用于伊辛机的多层前馈神经网络训练方法,该方法包括监督学习任务构建、问题形式转化、网络参数求解;其中监督学习任务构建是在训练数据集和量化神经网络参数上进行的二次有约束二值优化问题建模;其中问题形式转化是将构建的二次有约束二值优化问题转化为二次无约束二值优化问题;其中网络参数求解是在伊辛机上求解二次无约束二值优化问题的最优解,并对最优解进行解码得到最优量化神经网络参数,得到训练好的多层前馈神经网络。本发明实现了在伊辛机上训练多层前馈神经网络,作为一种非梯度训练方法提供了传统反向传播方法的替代方法。

    自动驾驶人工接管请求时机调节方法及系统

    公开(公告)号:CN113460074B

    公开(公告)日:2023-11-07

    申请号:CN202010238170.9

    申请日:2020-03-30

    Abstract: 本发明涉及自动驾驶人工接管请求时机调节方法及系统,能实现高的用户体验和接管质量。自动驾驶人工接管请求时机调节方法,在驾驶状态达到从自动驾驶模式转换为人工驾驶模式的自动驾驶系统性能边界之前向驾驶员发出接管请求,包括:构建个体驾驶员数据库步骤,将驾驶员完成一次接管记为一个接管事件并将和各接管事件所对应的数据组储存于该驾驶员的个体驾驶员数据库;接管请求提示步骤,计算驾驶员对于驾驶控制权的接管准备就绪程度R,并设定向驾驶员发出所述接管请求的提前时间T;接管质量评估步骤,根据驾驶员的实际操作数据计算接管事件的接管质量P;以及个体驾驶员数据库更新步骤,更新所述个体驾驶员数据库中的所述作用系数α′、β′。

Patent Agency Ranking