针对车辆的数据处理方法和数据处理模型的训练方法

    公开(公告)号:CN116300928A

    公开(公告)日:2023-06-23

    申请号:CN202310263862.2

    申请日:2023-03-17

    Abstract: 本公开提供了一种针对车辆的数据处理方法和数据处理模型的训练方法、装置、设备、介质和自动驾驶车辆,涉及人工智能领域,具体涉及自动驾驶和计算机视觉等技术领域。针对车辆的数据处理方法的具体实现方案为:采用感知网络对场景数据和车辆的运动数据进行编码,得到车辆所在场景中环境要素的要素特征;场景数据基于车辆上的传感器采集的原始数据得到;采用聚合网络对要素特征和与车辆所在位置对应的地图数据进行聚合,得到聚合特征;以及采用解码网络对聚合特征进行解码,得到针对车辆的预测结果,其中,预测结果包括车辆的预测轨迹信息,以及以下信息中的至少之一:环境要素的结构化信息、环境要素在未来时刻的预测位置信息。

    深度学习模型的训练方法、目标检测方法及装置

    公开(公告)号:CN116071625B

    公开(公告)日:2023-06-02

    申请号:CN202310206397.9

    申请日:2023-03-07

    Abstract: 本申请提供了一种深度学习模型的训练方法、目标检测方法及装置,涉及计算机视觉、深度学习。该训练方法具体实现方案为:利用第一深度学习模型对样本图像进行处理,得到第一图像特征;并根据初始位置分布特征图和第一图像特征,得到第一特征图。利用第二深度学习模型对样本图像进行处理,得到第二图像特征;并根据初始位置分布特征图和第二图像特征,得到第二特征图。利用第一深度学习模型对样本图像进行目标检测,得到第一检测结果。基于目标损失函数,根据第一检测结果、第一特征图和第二特征图,调整第一深度学习模型的模型参数和初始位置分布特征图,得到与样本图像对应的目标位置分布特征图和经训练的第一深度学习模型。

    一种自动驾驶感知模型的预训练方法、装置、设备和介质

    公开(公告)号:CN115860102A

    公开(公告)日:2023-03-28

    申请号:CN202310133636.2

    申请日:2023-02-10

    Abstract: 本公开提供了一种自动驾驶感知模型的预训练方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及计算机视觉、图像处理、深度学习等技术领域,可应用于自动驾驶、无人驾驶等场景。具体实现方案为:获取至少两种模态的训练样本;其中,所述训练样本包括无标注数据;按照设定的自监督学习顺序,采用至少两种模态的无标注数据,对感知模型中的特征提取网络,进行单一模态的模态内自监督学习和模态间自监督学习,以形成预训练完成的感知模型。本方案为自动驾驶感知模型提供了一种预训练方案,能够采用无标注数据,分别进行模态内自监督学习和模态间自监督学习,实现自动驾驶感知模型的预训练。

    文本识别模型的训练方法、文本识别方法及装置

    公开(公告)号:CN114372477B

    公开(公告)日:2022-06-10

    申请号:CN202210275278.4

    申请日:2022-03-21

    Abstract: 本公开提供了一种文本识别模型的训练方法、文本识别方法及装置,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于光学字符识别等场景。具体实现方案为:对获取到的样本图像的视觉特征进行掩码预测,得到预测视觉特征,对获取到的样本文本的语义特征进行掩码预测,得到预测语义特征,其中,样本图像中包括文本,根据预测视觉特征确定样本图像的文本的第一损失值,根据预测语义特征确定样本文本的第二损失值,根据第一损失值和第二损失值训练得到文本识别模型,以使得文本识别模型既能挖掘视觉信息,又能挖掘语义上下文逻辑,从而当基于文本识别模型进行文本识别时,可以提高文本识别的多样性和全面性。

    目标检测方法、装置和电子设备

    公开(公告)号:CN117541816B

    公开(公告)日:2025-03-04

    申请号:CN202311436010.5

    申请日:2023-10-31

    Abstract: 本公开提供了目标检测方法、装置和电子设备,涉及人工智能技术,尤其涉及计算机视觉、深度学习等技术领域。具体实现方案为:获取多视图图像的多尺度特征图;确定各尺度特征图在空间中的三维坐标信息,其中,每一尺度特征图的所述三维坐标信息包括该尺度特征图中每一像素点在空间中对应的多个点的三维坐标;将每一尺度特征图和该尺度特征图的三维坐标信息进行编码,根据编码结果确定多尺度特征图的三维位置感知特征;基于所述多尺度特征图的三维位置感知特征进行解码,得到多视图图像中的对象的对象类别和位置信息。有助于提高3D目标检测的准确度。

    车辆定位方法、装置、设备、介质、程序产品及自动驾驶车辆

    公开(公告)号:CN119131735A

    公开(公告)日:2024-12-13

    申请号:CN202411337422.8

    申请日:2024-09-24

    Abstract: 本公开提供了一种车辆定位方法、装置、设备、介质、程序产品及自动驾驶车辆,涉及人工智能领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于自动驾驶、自动泊车等场景。车辆定位方法包括:对采集的道路图像进行特征提取,得到图像特征;基于图像特征进行车道线排序检测,得到车道线排序信息,车道线排序信息表征道路图像中至少一个车道线的排列顺序;基于车道线排序特征和图像特征进行车道线检测,得到车道线信息,车道线排序特征表征车道线排序信息;基于车道线信息进行车辆定位,得到与目标车辆相关的目标车道线信息。

Patent Agency Ranking