-
公开(公告)号:CN118781189A
公开(公告)日:2024-10-15
申请号:CN202410903520.7
申请日:2024-07-08
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于多级3D高斯的密集RGB‑D SLAM方法,涉及三维场景重建和机器人自主导航领域。该方法包括:从RGB‑D相机获取连续的RGB图像和深度图数据流;对RGB‑D数据中的关键帧进行跟踪;设计多级高斯表示技术,将场景的几何和纹理细节分别用不同级别的高斯分布进行描述,并通过映射构建场景的三维地图;设计高斯渲染器对这些高斯分布进行渲染,生成RGB图像、深度图和可见性轮廓图;RGB‑D数据流与渲染结果作为输入反馈给系统的损失优化器,迭代优化多级高斯表示,最终重构出三维场景。本发明采用上述的一种基于多级3D高斯的密集RGB‑D SLAM方法,解决了现有方法在深度误差和渲染质量方面的不足,实现高精度的场景重建和导航。
-
公开(公告)号:CN119380300A
公开(公告)日:2025-01-28
申请号:CN202411318112.1
申请日:2024-09-20
Applicant: 桂林电子科技大学
IPC: G06V20/56 , G06V20/40 , G06V10/25 , G06V10/44 , G06V10/80 , G06V10/77 , G06V10/764 , G06V10/75 , G06V10/82
Abstract: 本发明提供了一种基于Transformer的3D多目标检测与跟踪方法,涉及自动驾驶和三维目标检测与跟踪技术领域。该方法包括:从六个摄像头获取连续帧的RGB图像数据流;对图像数据中的物体进行检测与跟踪;设计特征提取网络,将RGB数据流映射到鸟瞰图BEV上,以便更好地感知车辆周围环境;设计4D Tubelet Query以动态表示数据流中所有的tubelets;设计时序自注意力机制,融合长短时序上BEV特征信息,以捕捉目标的时序动态性;设计交叉注意力机制,融合4D Tubelet Query和BEV视频流,以动态学习多物体的外貌特征、角度信息以及轨迹信息等进行相应的学习;设计任务头,将Transformer获取的Query特征通过FFN生成最终的物体检测框和轨迹信息。本发明采用上述的一种基于Transformer的3D多目标检测与跟踪方法,解决了现有方法在三维多目标检测与跟踪上TBD的不足,巧妙地将检测与跟踪耦合,实现高精度的目标检测与跟踪。
-