一种基于混合神经网络模型的单目图像深度估计方法

    公开(公告)号:CN116934825A

    公开(公告)日:2023-10-24

    申请号:CN202310918311.5

    申请日:2023-07-25

    Inventor: 霍智勇 赵丽萍

    Abstract: 本发明属于计算机视觉领域,公开了一种基于混合神经网络模型的单目图像深度估计方法,包括:给定RGB图像和真实深度值,进行标准化操作,将RGB图像经过卷积模块,得到浅层的图像特征,然后将特征划分为块,进行不同区域的特征强化,得到带有重要程度判别的特征并将该特征依次经过Transformer模块,得到深层的特征,将浅层的图像特征与深层的特征组成图像特征序列,进行特征融合,得到完整的特征表示后利用深度信息输出块,获得的深度图,将深度图与真实深度值进行误差分析,得到最终的网络模型,完成深度估计。本发明建立了局部信息和远距离依赖关系,增强了对空间特征的捕获和对局部结构的表达,实现更准确的深度估计结果。

    一种基于多尺度交叉注意力的单目图像深度估计方法

    公开(公告)号:CN116258757A

    公开(公告)日:2023-06-13

    申请号:CN202310298112.9

    申请日:2023-03-24

    Inventor: 霍智勇 赵丽萍

    Abstract: 一种基于多尺度交叉注意力的单目图像深度估计方法,利用卷积神经网络和视觉Transformer优势互补,发挥卷积神经网络对局部特征捕获优势和Transformer对全局特征建立远距离依赖优势,提高对信息的保留能力,从而提高生成深度图的质量;通过交叉注意力机制,有效控制不同区域像素的注意力计算强度,均衡捕获局部特征和全局特征的能力,优化深度图整体结构,提高估计深度图的细粒度,同时估计的深度更为自然;提高图像局部特征和全局特征的捕获能力,解决单目深度估计方法中深度结构不够自然的问题,同时显著提高细节特征表达能力,解决单目深度估计细节不够丰富的问题;缓解基于视觉Transformer的单目深度估计方法计算资源的耗费巨大的问题,同时弥补Transformer对局部特征的弱敏感性。

Patent Agency Ranking