-
公开(公告)号:CN119992533A
公开(公告)日:2025-05-13
申请号:CN202410574545.7
申请日:2024-05-10
Applicant: 三星电子株式会社
Abstract: 提供了一种用于三维(3D)对象检测的方法和装置。该方法包括:接收相对于3D空间的输入图像、相对于3D空间的输入点云、以及相对于3D空间中的目标对象的输入语言;使用编码模型以生成输入图像的部分区域的候选图像特征、输入点云的点云特征、以及输入语言的语言特征;基于候选图像特征和语言特征之间的相似度的相似度分数,从候选图像特征之中选择与语言特征相对应的目标图像特征;通过基于目标图像特征和点云特征执行多模态解码模型来生成解码输出;以及通过基于解码输出执行对象检测模型来检测与目标对象相对应的3D边界框。