一种基于CNN和Transformer特征融合的单目深度估计方法

    公开(公告)号:CN118052859A

    公开(公告)日:2024-05-17

    申请号:CN202410067946.3

    申请日:2024-01-17

    Inventor: 霍智勇 王振东

    Abstract: 本发明属于计算机视觉领域,公开了一种基于CNN和Transformer特征融合的单目深度估计方法,包括:首先,构建混合深度数据集并对其进行预处理,将预处理后的图片输入网络提取CNN特征图,其次,使用特征转换模块得到类图像特征图并调整类图像特征图的尺度,获得四个Transformer特征图,而后将两个特征图输入引导融合模块,获得四个层级的特征图并将其输入解码融合模块,获得解码后的输出特征图;最后将输出特征图输入深度输出模块生成深度图,将深度图标签和深度图进行损失值计算,得到训练好的模型。本发明的双分支结构产生了提升了深度图的全局准确性,细化了局部纹理和边缘的表现,提高了模型的泛化能力。

Patent Agency Ranking