Patent search ap:("清华大学") AND inv:"段京良" Page 1

1.

发明公开
适用于端到端自动驾驶的动作平滑型强化学习策略网络审中-实审

公开(公告)号：CN119370109A

公开(公告)日：2025-01-28

申请号：CN202411389343.1

申请日：2024-09-30

Applicant: 清华大学

Inventor： 李升波 , 宋绪杰 , 刘童 , 段京良 , 郑一楠 , 王颢宁 , 林子钰 , 詹仙园 , 刘菁菁 , 张立平

IPC: B60W50/00 , B60W60/00 , G06F18/2131 , G06N3/092

Abstract: 本公开涉及适用于端到端自动驾驶的动作平滑型强化学习策略网络。包括：获取传感器采集的观测数据；将观测数据输入策略网络中的傅里叶滤波层，可以过滤观测噪音、提取观测输入中的重要频率，并得到滤波后的特征；将当前时刻的滤波后的特征输入策略网络中的后续子网络，得到车辆控制动作，车辆控制动作用于控制车辆进行自动驾驶；子网络使用雅克比正则化方法控制策略函数的平滑程度。根据本申请实施例，可以有效地解决强化学习用于端到端自动驾驶的动作震荡问题，提高策略网络输出的动作平滑性。

2.

发明公开
一种依托强化学习的PID轨迹跟踪控制方法及装置无效

公开(公告)号：CN118818957A

公开(公告)日：2024-10-22

申请号：CN202411073119.1

申请日：2024-08-06

Applicant: 北京科技大学 , 清华大学

Inventor： 黄晨 , 段京良 , 李升波 , 刘畅 , 李轩 , 朱哿宇 , 马飞

IPC: G05B11/42

Abstract: 本发明涉及自动驾驶领域，特别是指一种依托强化学习的PID轨迹跟踪控制方法及装置，方法包括：获取待控制自动驾驶车辆的当前状态、参考轨迹和实际运行误差；构建车辆轨迹跟踪控制的策略模型；将当前状态和参考轨迹输入至车辆轨迹跟踪控制的策略模型，得到PID控制参数；将PID控制参数和实际运行误差输入至PID控制器，得到自动驾驶车辆的控制量，根据自动驾驶车辆的控制量，完成自动驾驶车辆轨迹跟踪控制。本发明利用强化学习强大的学习能力结合PID本身的稳定性以及强鲁棒性，实现车辆轨迹跟踪控制的高实时、高稳定和高精度在线计算。解决当前车辆轨迹跟踪控制的计算实时性差、应用可靠性弱和依赖复杂动态模型等问题。

3.

发明公开
基于驾驶模式转换概率的驾驶风格估计方法有权

公开(公告)号：CN106023344A

公开(公告)日：2016-10-12

申请号：CN201610391483.1

申请日：2016-06-06

Applicant: 清华大学

Inventor： 李升波 , 成波 , 李国法 , 俞佳莹 , 王文军 , 段京良 , 王建强 , 李克强

IPC: G07C5/08 , G06K9/62

CPC classification number: G07C5/0808 , G06K9/6282 , G07C5/0841

Abstract: 本发明提供一种基于驾驶模式转换概率的驾驶风格估计方法，包括：步骤1、采集驾驶员的实际驾驶数据；其中所述实际驾驶历史数至少包括：方向盘转角、车速、纵向加速度、横向加速度；步骤2、根据实际驾驶数据，将驾驶行为分为N种驾驶行为模式；步骤3、确定驾驶行为模式转移概率，其中所述驾驶行为模式转移概率为N种驾驶行为模式中的任意两种驾驶行为模式之间的转换几率；步骤4、利用所述驾驶行为模式转移概率作为训练样本训练分类器，以通过所述分类器进行驾驶风格估计。

4.

发明公开
面向端到端自动驾驶的安全强化学习训练方法及装置审中-实审

公开(公告)号：CN119599088A

公开(公告)日：2025-03-11

申请号：CN202411432359.6

申请日：2024-10-14

Applicant: 清华大学

Inventor： 李升波 , 张宇航 , 吕尧 , 段京良 , 何雷 , 杨雨杰 , 郑志龙 , 詹仙园 , 张亚勤 , 李克强

IPC: G06N3/092 , G06N3/045

Abstract: 本申请涉及自动驾驶技术领域，特别涉及一种面向端到端自动驾驶的安全强化学习训练方法及装置，其中，方法包括：基于预设驾驶环境模型和不确定性约束衰减函数，检测车辆的当前决控策略的安全状态；利用预设集成模型拟合预设驾驶环境模型的分散随机误差；根据价值函数的自洽条件更新价值函数，评估当前决控策略的性能价值；根据不确定性约束衰减函数的自洽条件，更新不确定性约束衰减函数，扩展对应的可行区域；在安全状态达到预设等级时，基于随机误差、性能价值和扩展后的可行区域对当前决控策略进行迭代更新，直至当前决控策略的平均累计回报达到预设阈值或者达到最大迭代次数，得到最终可行决控策略，以强化目标自动驾驶系统。

5.

发明公开
一种面向机器人智能控制的平滑强化学习方法及装置审中-实审

公开(公告)号：CN119512079A

公开(公告)日：2025-02-25

申请号：CN202411494398.9

申请日：2024-10-24

Applicant: 北京科技大学 , 清华大学

Inventor： 段京良 , 陈良发 , 马飞 , 李升波 , 陈梓睿 , 吴思潮

IPC: G05D1/43 , G05D1/644 , G05D109/10

Abstract: 本发明提供一种面向机器人智能控制的平滑强化学习方法及装置，涉及机器人智能控制技术领域。该方法包括：获取当前时刻机器人的环境观测样本信息；根据当样本信息，构建平滑强化学习控制模型；根据样本信息，构建控制模型的奖励函数；采用机器人的离散时间运动学方程，构建控制模型的约束条件；将样本信息、奖励函数以及约束条件输入控制模型中进行在线训练，获得当前时刻机器人的平滑控制动作；构造控制模型的目标函数；根据目标函数对控制模型进更新，获得更新后的控制模型；根据平滑控制动作，获得下一时刻的观测样本信息，输入更新后的控制模型中，获得下一时刻机器人平滑控制动作。采用本发明可使机器人完成高实时且高精度的平滑控制任务。

6.

发明公开
轨迹预测方法、装置及存储介质有权

公开(公告)号：CN110146100A

公开(公告)日：2019-08-20

申请号：CN201810150320.3

申请日：2018-02-13

Applicant: 华为技术有限公司 , 清华大学

Inventor： 刘会 , 李升波 , 杜星星 , 成波 , 忻隆 , 段京良 , 高洪波

IPC: G01C21/34 , G05D1/02

Abstract: 本公开提供了一种轨迹预测方法、装置及存储介质，属于车辆控制技术领域。方法包括：获取目标车辆在当前时刻的多个第一驾驶行为特征值，目标车辆为本车周围的车辆，多个第一驾驶行为特征值与多个驾驶行为特征一一对应，多个驾驶行为特征为根据多个车辆的历史运动信息得到的与驾驶行为相关的特征，所述驾驶行为包括换道或者直行；根据所述多个第一驾驶行为特征值，识别所述目标车辆在所述当前时刻是否有换道意图；当识别到所述目标车辆在所述当前时刻有换道意图时，获取所述目标车辆与所述本车之间的相对距离；根据所述相对距离，通过预设的轨迹预测方程，预测所述目标车辆的运动轨迹。本公开能够准确识别目标车辆的换道意图，并准确预测运动轨迹。

7.

发明授权
基于驾驶模式转换概率的驾驶风格估计方法有权

公开(公告)号：CN106023344B

公开(公告)日：2019-04-05

申请号：CN201610391483.1

申请日：2016-06-06

Applicant: 清华大学

Inventor： 李升波 , 成波 , 李国法 , 俞佳莹 , 王文军 , 段京良 , 王建强 , 李克强

IPC: G07C5/08 , G06K9/62

Abstract: 本发明提供一种基于驾驶模式转换概率的驾驶风格估计方法，包括：步骤1、采集驾驶员的实际驾驶数据；其中所述实际驾驶历史数至少包括：方向盘转角、车速、纵向加速度、横向加速度；步骤2、根据实际驾驶数据，将驾驶行为分为N种驾驶行为模式；步骤3、确定驾驶行为模式转移概率，其中所述驾驶行为模式转移概率为N种驾驶行为模式中的任意两种驾驶行为模式之间的转换几率；步骤4、利用所述驾驶行为模式转移概率作为训练样本训练分类器，以通过所述分类器进行驾驶风格估计。

8.

发明授权
轨迹预测方法、装置及存储介质有权

公开(公告)号：CN110146100B

公开(公告)日：2021-08-13

申请号：CN201810150320.3

申请日：2018-02-13

Applicant: 华为技术有限公司 , 清华大学

Inventor： 刘会 , 李升波 , 杜星星 , 成波 , 忻隆 , 段京良 , 高洪波

IPC: G01C21/34 , G05D1/02

Abstract: 本公开提供了一种轨迹预测方法、装置及存储介质，属于车辆控制技术领域。方法包括：获取目标车辆在当前时刻的多个第一驾驶行为特征值，目标车辆为本车周围的车辆，多个第一驾驶行为特征值与多个驾驶行为特征一一对应，多个驾驶行为特征为根据多个车辆的历史运动信息得到的与驾驶行为相关的特征，所述驾驶行为包括换道或者直行；根据所述多个第一驾驶行为特征值，识别所述目标车辆在所述当前时刻是否有换道意图；当识别到所述目标车辆在所述当前时刻有换道意图时，获取所述目标车辆与所述本车之间的相对距离；根据所述相对距离，通过预设的轨迹预测方程，预测所述目标车辆的运动轨迹。本公开能够准确识别目标车辆的换道意图，并准确预测运动轨迹。

9.

发明公开
一种依托强化学习的PID轨迹跟踪控制方法及装置审中-实审

公开(公告)号：CN119739151A

公开(公告)日：2025-04-01

申请号：CN202411674068.8

申请日：2024-11-21

Applicant: 北京科技大学 , 清华大学

Inventor： 陈梓睿 , 段京良 , 李升波 , 黄晨 , 刘畅 , 居易 , 李轩 , 朱哿宇 , 马飞

IPC: G05D1/43 , G05D1/65 , G05D1/644 , G05D1/648 , G05D109/10

Abstract: 本发明涉及自动驾驶领域，特别是指一种依托强化学习的PID轨迹跟踪控制方法及装置，方法包括：获取待控制自动驾驶车辆的当前状态、参考轨迹和实际运行误差；构建车辆轨迹跟踪控制的策略模型；将当前状态和参考轨迹输入至车辆轨迹跟踪控制的策略模型，得到PID控制参数；将PID控制参数和实际运行误差输入至PID控制器，得到自动驾驶车辆的控制量，根据自动驾驶车辆的控制量，完成自动驾驶车辆轨迹跟踪控制。本发明利用强化学习强大的学习能力结合PID本身的稳定性以及强鲁棒性，实现车辆轨迹跟踪控制的高实时、高稳定和高精度在线计算。解决当前车辆轨迹跟踪控制的计算实时性差、应用可靠性弱和依赖复杂动态模型等问题。

10.

发明授权
多车干扰场景下行为认知驱动的周围车辆轨迹预测方法有权转让

公开(公告)号：CN118701099B

公开(公告)日：2025-03-14

申请号：CN202410176584.1

申请日：2024-02-08

Applicant: 北京科技大学 , 清华大学

Inventor： 王越 , 段宏伟 , 赵宁 , 段京良 , 高博麟 , 李克强

IPC: B60W60/00

Abstract: 本发明涉及智能驾驶技术领域，公开了多车干扰场景下行为认知驱动的周围车辆轨迹预测方法，多车干扰场景下行为认知驱动的周围车辆轨迹预测方法包括：根据获取到的城市道路驾驶数据，确定自车的周围车辆中具有主干扰因素的目标车辆、第一及第二行为特性；根据环境信息和目标车辆的驾驶人状态监测信息，确定目标情绪特征；根据第一行为特性、第二行为特性、目标车辆驾驶行为对应的目标情绪特征以及道路几何特征得到目标车辆的行为意图；根据获取到的道路几何特征、道路动态要素、多车交互干扰运动特性以及多车干扰交互意图信息，确定目标路况信息；根据行为意图以及目标路况信息得到轨迹预测结果。本发明实现周围车辆的运行轨迹的准确预测。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification