-
公开(公告)号:CN117746134A
公开(公告)日:2024-03-22
申请号:CN202311766830.0
申请日:2023-12-20
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/764 , G06V10/25 , G06V20/40 , G06V10/42
Abstract: 本公开提供了检测框的标签生成方法、装置、设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、虚拟现实、深度学习、大模型等技术领域。具体实现方案为:获取多帧时序图像,以及多帧时序图像对应的多帧原始点云数据;分别提取多帧原始点云数据对应的多个三维检测框;根据多帧原始点云数据和多个三维检测框,生成混合点云数据;提取多帧时序图像对应的多视角图像特征;根据多视角图像特征和混合点云数据,确定多模态融合特征;基于多模态融合特征对多模态长时序下的三维检测框进行优化调整,以采用优化调整后的检测框生成目标标签数据。
-
公开(公告)号:CN117636127A
公开(公告)日:2024-03-01
申请号:CN202311622742.3
申请日:2023-11-30
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/82 , G06V10/764 , G06V10/766 , G06V10/40 , G06V20/56 , G06V20/64 , G06N3/0455 , G06N3/0895
Abstract: 本申请公开了预训练模型的生成方法、装置、电子设备和存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、虚拟现实、深度学习、大模型领域,可应用于自动驾驶等场景。方案为:获取第一样本点云,并对第一样本点云进行体素化处理,得到第一体素;将第一体素进行掩码处理,得到第二体素,第二体素包括掩码体素;对第二体素进行特征提取,得到第一特征向量;根据第一特征向量进行预测,得到掩码体素的预测几何特征;根据预测几何特征及掩码体素的真实几何特征之间的差异,对初始预训练模型进行训练,得到预训练模型。
-
公开(公告)号:CN114879981B
公开(公告)日:2023-06-06
申请号:CN202210594783.5
申请日:2022-05-27
Applicant: 北京百度网讯科技有限公司
Inventor: 张伟
IPC: G06F8/61
Abstract: 本公开提供了一种云操作系统的安装方法、装置、电子设备及存储介质,涉及云平台技术领域。具体实现方案为:接收安装请求,所述安装请求中携带目标子安装任务标识;所述目标子安装任务标识为云操作系统的安装任务中的子安装任务的标识;基于所述目标子安装任务标识和针对所述云操作系统的安装配置文件,执行针对所述云操作系统的安装操作。本公开的技术,能够有效地提高云操作系统的安装效率。
-
公开(公告)号:CN115860102B
公开(公告)日:2023-05-23
申请号:CN202310133636.2
申请日:2023-02-10
Applicant: 北京百度网讯科技有限公司
IPC: G06N3/0895 , G06N3/096 , G06N3/0464
Abstract: 本公开提供了一种自动驾驶感知模型的预训练方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及计算机视觉、图像处理、深度学习等技术领域,可应用于自动驾驶、无人驾驶等场景。具体实现方案为:获取至少两种模态的训练样本;其中,所述训练样本包括无标注数据;按照设定的自监督学习顺序,采用至少两种模态的无标注数据,对感知模型中的特征提取网络,进行单一模态的模态内自监督学习和模态间自监督学习,以形成预训练完成的感知模型。本方案为自动驾驶感知模型提供了一种预训练方案,能够采用无标注数据,分别进行模态内自监督学习和模态间自监督学习,实现自动驾驶感知模型的预训练。
-
公开(公告)号:CN114820700B
公开(公告)日:2023-05-16
申请号:CN202210355951.5
申请日:2022-04-06
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种对象跟踪方法及装置,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于图像处理、目标跟踪等场景。具体实现方案为:获取第一图像帧中第一对象的对象特征,第一图像帧为第一设备获取得到的。获取多个第二对象的对象特征和全局标识,第二对象为从第二设备的获取区域进入第一设备的获取区域的对象。根据第一对象的对象特征和多个第二对象的对象特征,在多个第二对象中确定目标对象。将目标对象的全局标识确定为第一对象的全局标识,并根据全局标识,确定第一对象的跨设备的移动轨迹。本公开的技术方案实现对象的跨设备的连续跟踪。
-
公开(公告)号:CN111079619B
公开(公告)日:2023-04-18
申请号:CN201911259327.X
申请日:2019-12-10
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开涉及人工智能领域。本公开的实施例提供了用于检测图像中的目标对象的方法和装置。该方法包括:利用预先训练的神经网络执行如下预测操作:检测二维图像中的目标对象,确定目标对象的二维包围框;确定目标对象的二维包围框与将目标对象的三维包围框投影至二维图像中得到的三维投影包围框之间的相对位置约束关系;方法还包括:根据目标对象的二维包围框以及目标对象的二维包围框与三维投影包围框之间的相对位置约束关系,确定目标对象的三维投影包围框。该方法提升了目标对象位置检测的准确性。
-
公开(公告)号:CN114549961B
公开(公告)日:2023-04-07
申请号:CN202210200235.X
申请日:2022-03-02
Applicant: 北京百度网讯科技有限公司
IPC: G06V20/00 , G06V10/764 , G06N3/0464 , G06N3/08
Abstract: 本公开提供了目标对象的检测方法、装置、设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、图像识别和深度学习技术,具体可应用于智慧城市和智慧交通场景。具体实现方案为:对接收到的原始图像进行特征提取处理,得到指定分辨率的特征图像;在特征图像中,确定与目标对象相关的至少一个有效区域;根据每个有效区域的中心点,确定目标对象的轮廓;根据有效区域、目标对象的轮廓,得到目标对象的检测结果。根据本公开的上述方案可以利用有效区域进行目标对象的类别识别,可以大幅提高识别准确率。
-
公开(公告)号:CN113066285B
公开(公告)日:2022-12-09
申请号:CN202110275617.4
申请日:2021-03-15
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了一种路况信息确定方法、装置、电子设备及存储介质,涉及数据处理技术领域,进一步涉及人工智能、深度学习及智能交通等技术,包括:根据待预测路段的导航轨迹数据确定所述待预测路段的轨迹预测路况信息;在确定所述待预测路段满足图像预测调度条件的情况下,根据所述待预测路段的路段图像数据确定所述待预测路段的图像预测路况信息;根据所述轨迹预测路况信息和/或所述图像预测路况信息确定所述待预测路段的目标预测路况信息。本申请实施例能够提高路况信息的准确率和时效性,从而提升用户体验。
-
公开(公告)号:CN115272705A
公开(公告)日:2022-11-01
申请号:CN202210910399.1
申请日:2022-07-29
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/46 , G06V10/762 , G06V10/77 , G06V10/774 , G06N3/08
Abstract: 本公开提供了一种显著性物体检测模型的训练方法、装置以及设备,涉及人工智能技术领域,具体涉及图像处理、计算机视觉和深度学习等技术领域,尤其涉及智慧城市、智能交通等场景。该方法的一具体实施方式包括:获取样本图像集中的样本图像的至少两个层次的特征张量;基于样本图像的至少两个层次的特征张量,生成样本图像的视觉对比度信息和样本图像集的视觉对比度信息混杂集合;基于样本图像的视觉对比度信息和样本图像集的视觉对比度信息混杂集合,生成视觉对比度融合信息;基于视觉对比度融合信息和样本图像的视觉对比度信息进行训练,得到显著性物体检测模型。该实施方式能够解决显著性物体检测模型学习中的视觉对比度偏差问题。
-
公开(公告)号:CN115100431A
公开(公告)日:2022-09-23
申请号:CN202210895275.0
申请日:2022-07-26
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种目标检测方法、神经网络及其训练方法、设备和介质,涉及人工智能领域,具体涉及图像处理、计算机视觉和深度学习等技术领域。目标检测方法包括:利用第一候选区域预测子网络确定待检测图像中的至少一个第一候选区域,以得到至少一个第一候选区域各自的第一几何特征;利用第一图像特征提取子网络确定至少一个第一候选区域中的每一个第一候选区域第一图像特征;针对至少一个第一候选区域中的每一个第一候选区域,利用第一特征融合子网络至少将该第一候选区域的第一图像特征和第一几何特征进行特征融合,以得到该第一候选区域的第一候选特征;利用检测子网络对至少一个第一候选区域各自的第一候选特征进行处理,以得到目标检测结果。
-
-
-
-
-
-
-
-
-