-
公开(公告)号:CN119295541A
公开(公告)日:2025-01-10
申请号:CN202411161655.7
申请日:2024-08-22
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供一种目标检测方法、装置、电子设备及存储介质。本公开涉及自动驾驶领域,尤其涉及自动驾驶的图像识别领域。具体实现方案为:响应于车辆的启动操作,控制相机拍摄当前时刻车辆所处道路图像,该图像为初始图像;在虚拟相机开启的情况下,基于单应矩阵对初始图像进行像素映射,得到虚拟相机图像;将虚拟相机图像输入预先训练好的第一检测模型,对虚拟相机图像进行检测处理,得到第一目标检测结果。根据本方案的公开,能够降低因相机参数差异引起的系统误差,提高目标检测的准确性。
-
公开(公告)号:CN111612820B
公开(公告)日:2023-10-13
申请号:CN202010415131.1
申请日:2020-05-15
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/62 , G06V20/58 , G06V20/54 , G06V10/422 , G06V10/56 , G06V10/74 , G06V10/764 , G06V10/82 , G06T7/246 , G06N3/045 , G06N3/08
Abstract: 本申请公开了一种多目标跟踪方法、特征提取模型的训练方法和装置,涉及计算机视觉领域,可用于自动驾驶。方案为:获取多个训练图像对,训练图像对包括第一目标和第二目标,将该训练图像对调整到预设尺寸后输入到特征提取模型进行训练,得到该训练图像对中的每个目标的特征以及该训练图像对中的两个目标的相似度,该特征提取模型为孪生神经网络模型,根据训练结果计算每个训练图像对的损失值,根据该多个训练图像对的损失值,对特征提取模型的参数进行调整。该方法训练得到的特征提取模型能够直接提取图像中的目标的特征,不再依赖于检测模型,且提取得到的图像特征更加准确,可以应用于后续的多目标跟踪过程中,提高了目标跟踪的准确性。
-
公开(公告)号:CN115879060B
公开(公告)日:2023-07-04
申请号:CN202310137829.5
申请日:2023-02-14
Applicant: 北京百度网讯科技有限公司
IPC: G06F18/25 , G01S13/86 , B60W60/00 , G06F123/02
Abstract: 本公开提供了一种基于多模态的自动驾驶感知方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及计算机视觉、图像处理、深度学习等技术领域,可应用于自动驾驶、无人驾驶等场景。具体实现方案为:从主车和路侧设备获取多模态输入信息;分别提取所述多模态输入信息的各模态特征;将所述各模态特征分别映射到全局3D空间,得到各模态全局特征;对所述各模态全局特征进行特征融合,得到所述全局3D空间的多模态融合特征;基于所述多模态融合特征实现自动驾驶感知。本公开可以提升自动驾驶感知精度。
-
公开(公告)号:CN118643338A
公开(公告)日:2024-09-13
申请号:CN202410804835.6
申请日:2024-06-20
Applicant: 北京百度网讯科技有限公司
IPC: G06F18/214 , G06F18/25
Abstract: 本公开提出了一种多任务融合检测模型的训练方法、多任务检测方法和装置,涉及计算机视觉和深度学习等人工智能技术领域,适用于自动驾驶技术领域,方法包括获取检测任务集合中各检测任务的单任务检测模型,并基于各单任务检测模型得到待训练的初始多任务融合检测模型;获取各检测任务的单任务采样数据集,以得到所述初始多任务融合检测模型的训练样本集,其中,所述训练样本集包括单任务样本和多任务样本;根据所述单任务样本和/或所述多任务样本对所述初始多任务融合检测模型进行训练,直至训练结束,得到训练好的目标多任务融合检测模型。
-
公开(公告)号:CN114266879A
公开(公告)日:2022-04-01
申请号:CN202111602127.7
申请日:2021-12-24
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种三维数据增强、模型训练检测方法、设备及自动驾驶车辆,涉及数据处理领域,具体涉及深度学习、自动驾驶等领域,包括:获取原始二维图像和原始二维图像匹配的真值标注数据;根据目标变换元素对原始二维图像和二维真值标注数据变换得到变换二维图像和变换二维真值标注数据;根据目标变换元素对原始内参矩阵变换得到变换内参矩阵;根据变换内参矩阵对三维真值标注数据进行二维投影得到投影真值标注数据;根据变换二维图像、变换二维真值标注数据和投影真值标注数据生成三维增强图像数据。本公开实施例能够提高三维样本数据的多样性,进而提高三维目标检测的精度和召回率。
-
公开(公告)号:CN111192230B
公开(公告)日:2023-09-19
申请号:CN202010003247.4
申请日:2020-01-02
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了一种基于多相机的图像处理方法、装置、设备和可读存储介质,涉及感知和自动驾驶技术领域。具体实现方案为:至少一个图形处理器GPU通过运行至少两个线程并行对多个相机发送的图像进行预测;中央处理器CPU通过运行至少两个线程对图像的预测结果并行进行后处理;所述CPU对后处理结果进行融合。本实施例中的GPU和CPU并行对图像进行处理,在多相机的图像处理场景中,能够提高图像处理速度,避免数据丢失。
-
公开(公告)号:CN113887400B
公开(公告)日:2022-10-14
申请号:CN202111154672.4
申请日:2021-09-29
Applicant: 北京百度网讯科技有限公司
IPC: G06V20/58 , G06V10/25 , G06V10/774 , G06K9/62 , G06V10/764 , G06N20/00
Abstract: 本公开提供了一种障碍物检测方法、模型训练方法、装置及自动驾驶车辆,涉及车辆技术领域,尤其涉及计算机视觉、自动驾驶、障碍物检测技术领域。实现方案为:获取相机采集到的待处理图像以及该相机对应的深度图,深度图包括相机的视野范围内的多个地面点各自的深度值;检测待处理图像中的障碍物所在的目标区域;以及至少基于深度图和目标区域,确定障碍物的深度值。
-
公开(公告)号:CN114663508A
公开(公告)日:2022-06-24
申请号:CN202210262030.4
申请日:2022-03-16
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种位姿检测方法及装置、路径规划方法及装置、电子设备、程序产品以及存储介质,涉及人工智能技术领域,尤其涉及自动驾驶技术领域。本公开首先确定目标对象的预估平面几何特征;之后,根据目标对象的标准空间几何特征和预估平面几何特征,确定目标对象的初始位姿信息;最后根据预估平面几何特征对初始位姿信息进行调整,得到目标位姿信息。本公开充分考虑了目标对象的空间几何特征和预估平面几何特征,能够有效提高确定的目标对象的目标位姿信息的准确性;另外本公开还可以基于摄像头的成像几何特征和预估平面几何特征对确定的初始位姿信息进行调整,进一步提高了确定的目标位姿信息的准确性。
-
公开(公告)号:CN113887400A
公开(公告)日:2022-01-04
申请号:CN202111154672.4
申请日:2021-09-29
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种障碍物检测方法、模型训练方法、装置及自动驾驶车辆,涉及车辆技术领域,尤其涉及计算机视觉、自动驾驶、障碍物检测技术领域。实现方案为:获取相机采集到的待处理图像以及该相机对应的深度图,深度图包括相机的视野范围内的多个地面点各自的深度值;检测待处理图像中的障碍物所在的目标区域;以及至少基于深度图和目标区域,确定障碍物的深度值。
-
公开(公告)号:CN111612820A
公开(公告)日:2020-09-01
申请号:CN202010415131.1
申请日:2020-05-15
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了一种多目标跟踪方法、特征提取模型的训练方法和装置,涉及计算机视觉领域,可用于自动驾驶。方案为:获取多个训练图像对,训练图像对包括第一目标和第二目标,将该训练图像对调整到预设尺寸后输入到特征提取模型进行训练,得到该训练图像对中的每个目标的特征以及该训练图像对中的两个目标的相似度,该特征提取模型为孪生神经网络模型,根据训练结果计算每个训练图像对的损失值,根据该多个训练图像对的损失值,对特征提取模型的参数进行调整。该方法训练得到的特征提取模型能够直接提取图像中的目标的特征,不再依赖于检测模型,且提取得到的图像特征更加准确,可以应用于后续的多目标跟踪过程中,提高了目标跟踪的准确性。
-
-
-
-
-
-
-
-
-