-
公开(公告)号:CN114648687B
公开(公告)日:2025-02-07
申请号:CN202210275347.1
申请日:2022-03-21
Applicant: 哈尔滨理工大学
IPC: G06T7/73 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08 , G06N3/048 , G06K7/14
Abstract: 本发明属于图像处理技术领域。本发明公开了一种基于深度学习的无需深度信息的物体位姿预测算法,可实时预测缺少深度信息的图片中包含物体的类别信息以及位姿信息,可有效降低目标位姿检测成本,提高目标识别以及目标位姿检测的实时性。本发明所述的一种基于深度学习的无需深度信息的物体位姿预测算法,只需以普通RGB图像作为输入,通过卷积神经网络直接预测目标物体的3D bounding box顶点的二维投影,通过Aruco二维码求解相机位姿得到相机的外部参数后计算得到目标物体的位姿信息。本发明所提出的位姿预测算法在Linemod数据集下的平均2D投影准确率可达到90.02%,能够有效降低目标位姿检测工作成本,提高目标检测的效率,同时保证目标检测与位姿预测的实时性。
-
公开(公告)号:CN114648687A
公开(公告)日:2022-06-21
申请号:CN202210275347.1
申请日:2022-03-21
Applicant: 哈尔滨理工大学
Abstract: 本发明属于图像处理技术领域。本发明公开了一种基于深度学习的无需深度信息的物体位姿预测算法,可实时预测缺少深度信息的图片中包含物体的类别信息以及位姿信息,可有效降低目标位姿检测成本,提高目标识别以及目标位姿检测的实时性。本发明所述的一种基于深度学习的无需深度信息的物体位姿预测算法,只需以普通RGB图像作为输入,通过卷积神经网络直接预测目标物体的3D bounding box顶点的二维投影,通过Aruco二维码求解相机位姿得到相机的外部参数后计算得到目标物体的位姿信息。本发明所提出的位姿预测算法在Linemod数据集下的平均2D投影准确率可达到90.02%,能够有效降低目标位姿检测工作成本,提高目标检测的效率,同时保证目标检测与位姿预测的实时性。
-