基于模仿学习初始化的强化学习换道行为规划方法及系统

    公开(公告)号:CN114954498B

    公开(公告)日:2025-01-07

    申请号:CN202210602932.8

    申请日:2022-05-30

    Abstract: 本发明提出了一种基于模仿学习初始化的强化学习换道行为规划方法及系统,通过将周围车辆的变形位姿和模糊速度通过渐变色映射到栅格图上,并将具有清晰信息的交通规则和道路状况使用向量表示,将两者连接输入模仿学习DAgger网络,使自动驾驶车辆学会遵守交通规则和基本的换道决策;再利用强化学习优化模仿学习换道机制,使其适应模仿学习数据集中没有的极端和未知交通场景;可以从车辆相互作用的驱动机制和环境中学习潜在的换道驾驶机制,简化人工驾驶建模,对变道场景的动态变化具有良好的适应性,对变道任务采用动态混合奖励机制;引入一种基于模仿学习的强化学习初始化方法,解决稀疏奖励下强化学习学习效率低的问题,只需要少量的场景数据。

    一种适用室内环境的轻量性预测式导航方法及系统

    公开(公告)号:CN116858253A

    公开(公告)日:2023-10-10

    申请号:CN202310965884.3

    申请日:2023-08-02

    Abstract: 本发明公开一种适用室内环境的轻量性预测式导航方法及系统,环境预测将所获得的感知信息与运动信息相结合,能够生成未来的环境预测和映射,表示为占据栅格图序列;运动规划将具有时间属性的网格序列作为搜索空间,并将轨迹解公式化为非线性优化问题,解算非线性优化问题得到轨迹;在统一的环境表征形式下,获取感知数据和车辆自身运动数据(速度,坐标)部分解耦动静态环境,静态环境通过坐标变换与映射得到未来位置,动态环境通过提取场景运动特征信息,预测未来若干步长的栅格地图,然后直接利用未来栅格,同时处理动静态障碍物,提升轨迹优化的效率和有效性;本发明提出的方法可以提高实时性能和安全性,同时降低计算需求。

    基于模仿学习初始化的强化学习换道行为规划方法及系统

    公开(公告)号:CN114954498A

    公开(公告)日:2022-08-30

    申请号:CN202210602932.8

    申请日:2022-05-30

    Abstract: 本发明提出了一种基于模仿学习初始化的强化学习换道行为规划方法及系统,通过将周围车辆的变形位姿和模糊速度通过渐变色映射到栅格图上,并将具有清晰信息的交通规则和道路状况使用向量表示,将两者连接输入模仿学习DAgger网络,使自动驾驶车辆学会遵守交通规则和基本的换道决策;再利用强化学习优化模仿学习换道机制,使其适应模仿学习数据集中没有的极端和未知交通场景;可以从车辆相互作用的驱动机制和环境中学习潜在的换道驾驶机制,简化人工驾驶建模,对变道场景的动态变化具有良好的适应性,对变道任务采用动态混合奖励机制;引入一种基于模仿学习的强化学习初始化方法,解决稀疏奖励下强化学习学习效率低的问题,只需要少量的场景数据。

    基于Transformers的自主车辆轨迹联合规划和预测方法及系统

    公开(公告)号:CN117369453A

    公开(公告)日:2024-01-09

    申请号:CN202311392609.3

    申请日:2023-10-25

    Abstract: 本发明公开一种利用transformers进行自动驾驶的联合规划与预测的InteractionNet架构。组成部分包括感知骨干网络:带有RGB以及激光雷达信息输入,在检测和语义分割的监督下,从PointPillars中得到地图‑视图感知特征φ。联合规划与预测:将φ转换为裁剪特征φ′,通过高层行为和稀疏GNSS目标的叠加,输出用于规划和预测的轨迹。碰撞感知控制器:检查所有轨迹之间的碰撞风险,产生横向和纵向命令来行驶自主车辆。局部和全局transformer:局部transformer处理过的裁剪特征被提供给全局transformer,所有车辆共享全局上下文推理,将规划和预测联合为整体。局部transformer引导模型更为区分每个车辆输入的不同区域裁剪特征的重要性,提升对关键性的或未见车辆区域的关注。本发明在多个基准测试中排名第一,在安全等方面上表现出卓越的性能。

    基于控制线的自动驾驶非结构化环境路径规划方法及系统

    公开(公告)号:CN116661436A

    公开(公告)日:2023-08-29

    申请号:CN202310352841.8

    申请日:2023-04-04

    Abstract: 本发明公开一种基于控制线的自动驾驶非结构化环境路径规划方法及系统,具体包括如下步骤:初始化起始控制线和目标控制线;从所有的子控制线中选择评价函数f值最小的控制线作为当前控制线;以当前控制线作为父控制线,通过定义的动作usucc生成子控制线;目标控制线回溯,生成最终骨架树;在生成的骨架树中进行进一步的选择生成最终路径。本发明提出的基于控制线的非结构化路径规划方法,基于控制线的非结构化路径规划方法可以忽略网格地图的分辨率限制,以更少的资源消耗获得更好的路径规划结果。本发明在仿真场景和实车测试中进行了实验,结果表明,大大提高了场景鲁棒性、计算效率和路径质量。

    基于多场耦合模型的超导能源管道整体失超预测方法

    公开(公告)号:CN112287515B

    公开(公告)日:2022-12-09

    申请号:CN202010986813.8

    申请日:2020-09-18

    Abstract: 一种基于多场耦合模型的超导能源管道整体失超预测方法,先测量不同温度下高温超导带材的临界电流,拟合得到临界电流Ic随温度变化的数据曲线Ic(T);然后建立电磁场模型,计算铜骨架电流分布Iformer(x);再根据低温燃料设计工况,建立流场分析模型,计算得到低温燃料的换热系数沿轴向分布h(x);然后根据电流分布Iformer(x)和换热系数分布h(x),建立热分析模型,计算得到超导能源管道轴向温度分布T(x);根据轴向温度分布T(x),更新模型参数,重复直至达到设定时间ttotal时,计算结束,并提取最高温度随时间的变化曲线T(t);最后判断超导能源管道最高温度变化T(t)是否符合能源管道整体失超判定准则;本发明提升超导能源管道运行安全性。

    一种应用于长距离超导能源管道的绝热结构

    公开(公告)号:CN113063055B

    公开(公告)日:2022-06-07

    申请号:CN202110276388.8

    申请日:2021-03-15

    Abstract: 一种应用于长距离超导能源管道的绝热结构,包括超导能源管道外侧设有的二氧化碳腔室,二氧化碳腔室外侧依次设有堆积绝热层、绝热结构外壁面;二氧化碳腔室为封闭腔,设有中间绝热层和二氧化碳吸附板,中间绝热层由间隔排列的辐射屏蔽层和低温绝热纸组成;运行前,向二氧化碳腔室内充入二氧化碳气体,直至完全充满;打开低温燃料通道进行管道预冷,使得二氧化碳腔室内二氧化碳气体凝华,二氧化碳腔室内变为真空腔,再运行超导电缆;本发明可大大降低能源管道的建设和运行成本。

    基于时空交互图和危险区域的机器人人群导航方法及系统

    公开(公告)号:CN117232522A

    公开(公告)日:2023-12-15

    申请号:CN202311173559.X

    申请日:2023-09-12

    Abstract: 本发明公开一种基于时空交互图和危险区域的机器人人群导航方法及系统,所述方法利用时空交互图的注意力机制来捕获机器人与其它代理的协商合作交互,使用注意力机制的图神经网络,进行时空推理理解行人间的隐式交互,创建一个可以在部分可观察的人群中符合社会要求的机器人自主导航;通过考虑行人的运动学模型,构建一个实时的受约束行动空间,即潜在的危险区域,在不确定和动态的拥挤场景中,行人根据其身体状况以不可预测的速度导航,本发明构造基于行人运动特性的危险区域,显示建模机器人的受约束运动空间,没有任何专家监督的情况下使用无模型深度强化学习来训练网络,使机器人能够在人群导航中执行高效的时空推理。

    一种基于神经点渲染的自动驾驶场景仿真方法及系统

    公开(公告)号:CN117150755A

    公开(公告)日:2023-12-01

    申请号:CN202311090163.9

    申请日:2023-08-28

    Abstract: 本发明公开一种基于点的神经渲染的自主驾驶场景仿真方法及系统,方法通过对场景的重建和扩展,能够在不同视角下生成自动驾驶系统的真实测试数据,使用采集到的真实点云数据提供准确的深度和位置指导,避免多视图重建得到的点云可能包含的几何错误,为每个点云分配隐变量以估计其颜色信息外,附加与观察视角和采样频率相关的特征,扩展神经描述符,以更好地表征场景在不同观察视角和距离下的外观特征,使用多尺度特征融合和渐进式渲染等方法填充点云的缺失区域,并提出点云补全算法在较近和较远处增加点云密度。最后,通过神经描述符对动态障碍物进行编辑,以扩充仿真的丰富性,以模拟交通参与者的不同状态,丰富并扩展视觉仿真场景。

    基于类人特征的自动驾驶强化学习决策与规划方法及系统

    公开(公告)号:CN117104267A

    公开(公告)日:2023-11-24

    申请号:CN202311090168.1

    申请日:2023-08-28

    Abstract: 本发明中公开一种基于类人特征的自动驾驶强化学习决策与规划方法及系统,所述决策与规划方法通过分析交通参与者的驾驶风格来确定和量化当前情况下适合自主车辆的驾驶风格;通过A2C算法训练自主车辆的行为策略,即直行车道保持/跟随、左换道和右换道;遵从所述驾驶风格和行为决策,以路径速度解耦的方式生成类人安全的轨迹;本发明所述方法捕捉了其他交通参与者的属性,以指导自动驾驶汽车以社会兼容的方式设计类似人类的、安全高效的轨迹,在复杂的多场景中实现安全与效率之间的平衡。分层行为和运动规划将驾驶任务确立为强调效率的高级行为决策过程,以及优先考虑安全的低级运动规划方法。

Patent Agency Ranking