-
公开(公告)号:CN117541816A
公开(公告)日:2024-02-09
申请号:CN202311436010.5
申请日:2023-10-31
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/52 , G06V10/764 , G06V10/82 , G06V10/80 , G06N3/0464
Abstract: 本公开提供了目标检测方法、装置和电子设备,涉及人工智能技术,尤其涉及计算机视觉、深度学习等技术领域。具体实现方案为:获取多视图图像的多尺度特征图;确定各尺度特征图在空间中的三维坐标信息,其中,每一尺度特征图的所述三维坐标信息包括该尺度特征图中每一像素点在空间中对应的多个点的三维坐标;将每一尺度特征图和该尺度特征图的三维坐标信息进行编码,根据编码结果确定多尺度特征图的三维位置感知特征;基于所述多尺度特征图的三维位置感知特征进行解码,得到多视图图像中的对象的对象类别和位置信息。有助于提高3D目标检测的准确度。
-
公开(公告)号:CN117541816B
公开(公告)日:2025-03-04
申请号:CN202311436010.5
申请日:2023-10-31
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/52 , G06V10/764 , G06V10/82 , G06V10/80 , G06N3/0464
Abstract: 本公开提供了目标检测方法、装置和电子设备,涉及人工智能技术,尤其涉及计算机视觉、深度学习等技术领域。具体实现方案为:获取多视图图像的多尺度特征图;确定各尺度特征图在空间中的三维坐标信息,其中,每一尺度特征图的所述三维坐标信息包括该尺度特征图中每一像素点在空间中对应的多个点的三维坐标;将每一尺度特征图和该尺度特征图的三维坐标信息进行编码,根据编码结果确定多尺度特征图的三维位置感知特征;基于所述多尺度特征图的三维位置感知特征进行解码,得到多视图图像中的对象的对象类别和位置信息。有助于提高3D目标检测的准确度。
-