-
公开(公告)号:CN115860102B
公开(公告)日:2023-05-23
申请号:CN202310133636.2
申请日:2023-02-10
Applicant: 北京百度网讯科技有限公司
IPC: G06N3/0895 , G06N3/096 , G06N3/0464
Abstract: 本公开提供了一种自动驾驶感知模型的预训练方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及计算机视觉、图像处理、深度学习等技术领域,可应用于自动驾驶、无人驾驶等场景。具体实现方案为:获取至少两种模态的训练样本;其中,所述训练样本包括无标注数据;按照设定的自监督学习顺序,采用至少两种模态的无标注数据,对感知模型中的特征提取网络,进行单一模态的模态内自监督学习和模态间自监督学习,以形成预训练完成的感知模型。本方案为自动驾驶感知模型提供了一种预训练方案,能够采用无标注数据,分别进行模态内自监督学习和模态间自监督学习,实现自动驾驶感知模型的预训练。
-
公开(公告)号:CN115272705A
公开(公告)日:2022-11-01
申请号:CN202210910399.1
申请日:2022-07-29
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/46 , G06V10/762 , G06V10/77 , G06V10/774 , G06N3/08
Abstract: 本公开提供了一种显著性物体检测模型的训练方法、装置以及设备,涉及人工智能技术领域,具体涉及图像处理、计算机视觉和深度学习等技术领域,尤其涉及智慧城市、智能交通等场景。该方法的一具体实施方式包括:获取样本图像集中的样本图像的至少两个层次的特征张量;基于样本图像的至少两个层次的特征张量,生成样本图像的视觉对比度信息和样本图像集的视觉对比度信息混杂集合;基于样本图像的视觉对比度信息和样本图像集的视觉对比度信息混杂集合,生成视觉对比度融合信息;基于视觉对比度融合信息和样本图像的视觉对比度信息进行训练,得到显著性物体检测模型。该实施方式能够解决显著性物体检测模型学习中的视觉对比度偏差问题。
-
公开(公告)号:CN115909173A
公开(公告)日:2023-04-04
申请号:CN202310010750.6
申请日:2023-01-05
Applicant: 北京百度网讯科技有限公司
IPC: G06V20/40 , G06N3/0464 , G06N3/08 , G06V10/774 , G06V10/82
Abstract: 本公开提供了一种物体跟踪方法、跟踪模型训练方法、装置、设备和介质,涉及计算机视觉、图像处理、深度学习等人工智能技术领域,可应用于自动驾驶、智慧城市等场景。具体实现方案为:获取用于训练物体跟踪模型的多个样本视频;在任一视频帧作为当前视频帧,对所述物体跟踪模型进行训练的过程中,将所述当前视频帧的图像数据和初始化的物体特征向量,输入所述物体跟踪模型,以输出识别到的物体,作为物体识别结果;其中,所述当前视频帧的初始化的物体特征向量,为基于至少一个历史视频帧中已识别物体的物体特征向量确定的;根据所述物体识别结果,基于预设损失函数对物体跟踪模型进行更新。实施例的技术方案,能够使得物体识别结果更加准确。
-
公开(公告)号:CN115860102A
公开(公告)日:2023-03-28
申请号:CN202310133636.2
申请日:2023-02-10
Applicant: 北京百度网讯科技有限公司
IPC: G06N3/0895 , G06N3/096 , G06N3/0464
Abstract: 本公开提供了一种自动驾驶感知模型的预训练方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及计算机视觉、图像处理、深度学习等技术领域,可应用于自动驾驶、无人驾驶等场景。具体实现方案为:获取至少两种模态的训练样本;其中,所述训练样本包括无标注数据;按照设定的自监督学习顺序,采用至少两种模态的无标注数据,对感知模型中的特征提取网络,进行单一模态的模态内自监督学习和模态间自监督学习,以形成预训练完成的感知模型。本方案为自动驾驶感知模型提供了一种预训练方案,能够采用无标注数据,分别进行模态内自监督学习和模态间自监督学习,实现自动驾驶感知模型的预训练。
-
公开(公告)号:CN115082740B
公开(公告)日:2023-09-01
申请号:CN202210839698.0
申请日:2022-07-18
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/764 , G06V10/82 , G06N3/045 , G06N3/08
Abstract: 本公开提供了一种目标检测模型的训练方法、目标检测方法、装置、电子设备和介质,涉及人工智能领域,尤其涉及图像处理、计算机视觉和深度学习等技术领域,可应用于智慧城市、智能交通等场景。一种目标检测模型的训练方法,包括:获得第一样本图像和第一样本图像的真实类别;基于第一样本图像,通过第一子网络获得第一样本图像的图像特征;基于第一样本图像的图像特征,根据第二子网络获得第一样本图像的预测类别;基于第一样本图像的图像特征和真实类别的第一向量表示确定第一损失值;基于预测类别和真实类别的第二向量表示确定第二损失值;以及基于第一损失值和第二损失值调整目标检测模型的参数。
-
公开(公告)号:CN115907009B
公开(公告)日:2023-05-26
申请号:CN202310147702.1
申请日:2023-02-10
Applicant: 北京百度网讯科技有限公司
IPC: G06N5/02 , G06N3/0464 , G06N3/096
Abstract: 本公开提供了一种自动驾驶感知模型的迁移方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及计算机视觉、图像处理、深度学习等技术领域,可应用于自动驾驶、无人驾驶等场景。具体实现方案为:获取一种或多种模态的训练样本;采用所述训练样本进行感知模型训练,以训练完成至少两个版本的感知模型;采用所述训练样本,基于训练后的至少两个版本的感知模型,进行知识迁移,以形成车端模型。本公开提高了知识迁移形成车端模型的灵活性和多样性,提高了车端模型的准确性。
-
公开(公告)号:CN115879535B
公开(公告)日:2023-05-23
申请号:CN202310134421.2
申请日:2023-02-10
Applicant: 北京百度网讯科技有限公司
IPC: G06N3/0895 , G06N3/084 , G06N3/096 , G06N3/0464 , G06F18/25
Abstract: 本公开提供了一种自动驾驶感知模型的训练方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及计算机视觉、图像处理、深度学习等技术领域,可应用于自动驾驶、智慧城市等场景。该训练方法包括:获取一种或多种模态的训练样本;采用设定场景的有标注数据对感知模型进行场景化训练;采用所述训练样本对场景化后的感知模型进行半监督训练,以更新所述感知模型并形成伪标注数据,且将所述伪标注数据更新至所述训练样本中;采用训练样本,基于半监督训练后的感知模型,进行知识迁移,以形成车端模型。本公开提供的方案充分发挥了自动驾驶场景海量数据和大模型的优势。
-
公开(公告)号:CN115879535A
公开(公告)日:2023-03-31
申请号:CN202310134421.2
申请日:2023-02-10
Applicant: 北京百度网讯科技有限公司
IPC: G06N3/0895 , G06N3/084 , G06N3/096 , G06N3/0464 , G06F18/25
Abstract: 本公开提供了一种自动驾驶感知模型的训练方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及计算机视觉、图像处理、深度学习等技术领域,可应用于自动驾驶、智慧城市等场景。该训练方法包括:获取一种或多种模态的训练样本;采用设定场景的有标注数据对感知模型进行场景化训练;采用所述训练样本对场景化后的感知模型进行半监督训练,以更新所述感知模型并形成伪标注数据,且将所述伪标注数据更新至所述训练样本中;采用训练样本,基于半监督训练后的感知模型,进行知识迁移,以形成车端模型。本公开提供的方案充分发挥了自动驾驶场景海量数据和大模型的优势。
-
公开(公告)号:CN115909173B
公开(公告)日:2023-09-26
申请号:CN202310010750.6
申请日:2023-01-05
Applicant: 北京百度网讯科技有限公司
IPC: G06V20/40 , G06N3/0464 , G06N3/08 , G06V10/774 , G06V10/82
Abstract: 本公开提供了一种物体跟踪方法、跟踪模型训练方法、装置、设备和介质,涉及计算机视觉、图像处理、深度学习等人工智能技术领域,可应用于自动驾驶、智慧城市等场景。具体实现方案为:获取用于训练物体跟踪模型的多个样本视频;在任一视频帧作为当前视频帧,对所述物体跟踪模型进行训练的过程中,将所述当前视频帧的图像数据和初始化的物体特征向量,输入所述物体跟踪模型,以输出识别到的物体,作为物体识别结果;其中,所述当前视频帧的初始化的物体特征向量,为基于至少一个历史视频帧中已识别物体的物体特征向量确定的;根据所述物体识别结果,基于预设损失函数对物体跟踪模型进行更新。实施例的技术方案,能够使得物体识别结果更加准确。
-
公开(公告)号:CN115272705B
公开(公告)日:2023-08-29
申请号:CN202210910399.1
申请日:2022-07-29
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/46 , G06V10/762 , G06V10/77 , G06V10/774 , G06N3/088
Abstract: 本公开提供了一种显著性物体检测模型的训练方法、装置以及设备,涉及人工智能技术领域,具体涉及图像处理、计算机视觉和深度学习等技术领域,尤其涉及智慧城市、智能交通等场景。该方法的一具体实施方式包括:获取样本图像集中的样本图像的至少两个层次的特征张量;基于样本图像的至少两个层次的特征张量,生成样本图像的视觉对比度信息和样本图像集的视觉对比度信息混杂集合;基于样本图像的视觉对比度信息和样本图像集的视觉对比度信息混杂集合,生成视觉对比度融合信息;基于视觉对比度融合信息和样本图像的视觉对比度信息进行训练,得到显著性物体检测模型。该实施方式能够解决显著性物体检测模型学习中的视觉对比度偏差问题。
-
-
-
-
-
-
-
-
-