一种面向三维场景重建的高精度单目深度估计系统及方法

    公开(公告)号:CN115272438A

    公开(公告)日:2022-11-01

    申请号:CN202210999767.4

    申请日:2022-08-19

    Abstract: 本发明公开一种面向三维场景重建的高精度单目深度估计系统及方法,属于图像处理技术领域,在编码器处通过引入Vision Transformers主干网络,ViT主干网络代替卷积网络作为密集预测的主干架构,以恒定的和相对较高的分辨率处理表示,并在每个阶段都有一个全局的接受域,以减少卷积网络中下采样过程中的信息丢失,从而获取图像更多的细节特征和感受野。在解码器处通过利用小波变换来捕获深度图中深度不同的平坦区域之间的深度“跳跃”,这些“跳跃”可以很好地在高频分量中捕获,从而达到强化深度信息图边缘的效果。通过对ViT和小波变换的引入,能够在不使得网络计算更复杂的前提下,又兼顾单目深度估计网络模型对全局特征和局部边缘特征的提取,提高单目深度估计的精度。

Patent Agency Ranking