一种关键点热力图引导的自监督单目视觉里程计方法

    公开(公告)号:CN114663509B

    公开(公告)日:2022-09-27

    申请号:CN202210290488.0

    申请日:2022-03-23

    Abstract: 本发明提供一种关键点热力图引导的自监督单目视觉里程计方法,属于计算机视觉领域。所述方法包括:构建位姿估计网络与深度估计网络;将视频图像序列输入位姿估计网络与深度估计网络;提取视频图像序列中每帧图像的关键点并生成关键点热力图;将位姿估计网络输出的每对相邻帧图像之间的位姿相乘得到较长时段的位姿,并基于深度估计网络输出的深度图像以及生成的关键点热力图,计算视频图像序列位姿一致性约束的光度误差损失函数;基于得到的光度误差损失函数,训练所述位姿估计网络与深度估计网络;利用训练好的位姿估计网络估计待估计位姿的视频图像序列中每帧图像对应的相机位姿。采用本发明,能够提高相机位姿估计的精度。

    一种基于卡尔曼位姿估计网络的单目视觉里程计方法

    公开(公告)号:CN114663496B

    公开(公告)日:2022-10-18

    申请号:CN202210290482.3

    申请日:2022-03-23

    Abstract: 本发明提供一种基于卡尔曼位姿估计网络的单目视觉里程计方法,属于计算机视觉技术领域。所述方法包括:构建深度估计网络和基于卡尔曼滤波的位姿估计网络;根据位姿估计网络输出的每对相邻帧图像之间的位姿变换以及深度估计网络输出的输入帧的深度图像,计算视频图像序列基于运动加权的光度误差损失函数;在构建的位姿估计网络与深度估计网络中,引入变分自动编码器结构,计算变分自动编码器损失函数;基于得到的光度误差损失函数和变分自动编码器损失函数,采取针对帧缺失情况的训练策略训练位姿估计网络与深度估计网络;利用训练好的位姿估计网络估计每帧图像对应的相机位姿。采用本发明,能够提高相机位姿估计的精度并适应帧缺失的情况。

    一种关键点热力图引导的自监督单目视觉里程计方法

    公开(公告)号:CN114663509A

    公开(公告)日:2022-06-24

    申请号:CN202210290488.0

    申请日:2022-03-23

    Abstract: 本发明提供一种关键点热力图引导的自监督单目视觉里程计方法,属于计算机视觉领域。所述方法包括:构建位姿估计网络与深度估计网络;将视频图像序列输入位姿估计网络与深度估计网络;提取视频图像序列中每帧图像的关键点并生成关键点热力图;将位姿估计网络输出的每对相邻帧图像之间的位姿相乘得到较长时段的位姿,并基于深度估计网络输出的深度图像以及生成的关键点热力图,计算视频图像序列位姿一致性约束的光度误差损失函数;基于得到的光度误差损失函数,训练所述位姿估计网络与深度估计网络;利用训练好的位姿估计网络估计待估计位姿的视频图像序列中每帧图像对应的相机位姿。采用本发明,能够提高相机位姿估计的精度。

    一种基于交叉注意力网络的回环检测方法

    公开(公告)号:CN115631319B

    公开(公告)日:2023-06-23

    申请号:CN202211361582.7

    申请日:2022-11-02

    Abstract: 本发明提供一种基于交叉注意力网络的回环检测方法,属于计算机视觉技术领域。所述方法包括:对激光雷达原始三维点云数据进行预处理,获得对应的球面投影图,即训练帧;构建基于自注意力机制和交叉注意力机制的重叠度估计网络;利用得到的训练帧,训练所述重叠度估计网络;利用训练好的重叠度估计网络估计每对扫描对之间的重叠度,扫描对为两帧激光雷达的球面投影图,选取重叠度估计值高于阈值的扫描对作为回环检测候选对象,对于当前帧,选择重叠度估计值最大的候选者作为回环匹配帧,且判定该回环匹配帧位置为回环检测结果。采用本发明,能够提高回环检测或地点识别中的准确率和召回率。

    一种基于交叉注意力网络的回环检测方法

    公开(公告)号:CN115631319A

    公开(公告)日:2023-01-20

    申请号:CN202211361582.7

    申请日:2022-11-02

    Abstract: 本发明提供一种基于交叉注意力网络的回环检测方法,属于计算机视觉技术领域。所述方法包括:对激光雷达原始三维点云数据进行预处理,获得对应的球面投影图,即训练帧;构建基于自注意力机制和交叉注意力机制的重叠度估计网络;利用得到的训练帧,训练所述重叠度估计网络;利用训练好的重叠度估计网络估计每对扫描对之间的重叠度,扫描对为两帧激光雷达的球面投影图,选取重叠度估计值高于阈值的扫描对作为回环检测候选对象,对于当前帧,选择重叠度估计值最大的候选者作为回环匹配帧,且判定该回环匹配帧位置为回环检测结果。采用本发明,能够提高回环检测或地点识别中的准确率和召回率。

    一种基于卡尔曼位姿估计网络的单目视觉里程计方法

    公开(公告)号:CN114663496A

    公开(公告)日:2022-06-24

    申请号:CN202210290482.3

    申请日:2022-03-23

    Abstract: 本发明提供一种基于卡尔曼位姿估计网络的单目视觉里程计方法,属于计算机视觉技术领域。所述方法包括:构建深度估计网络和基于卡尔曼滤波的位姿估计网络;根据位姿估计网络输出的每对相邻帧图像之间的位姿变换以及深度估计网络输出的输入帧的深度图像,计算视频图像序列基于运动加权的光度误差损失函数;在构建的位姿估计网络与深度估计网络中,引入变分自动编码器结构,计算变分自动编码器损失函数;基于得到的光度误差损失函数和变分自动编码器损失函数,采取针对帧缺失情况的训练策略训练位姿估计网络与深度估计网络;利用训练好的位姿估计网络估计每帧图像对应的相机位姿。采用本发明,能够提高相机位姿估计的精度并适应帧缺失的情况。

    一种基于大模型引导的图像分割方法

    公开(公告)号:CN118298169A

    公开(公告)日:2024-07-05

    申请号:CN202410236797.9

    申请日:2024-03-01

    Abstract: 本发明公开了一种基于大模型引导的图像分割方法,属于图像处理与计算机视觉技术领域,该方法包括:构建大模型引导分割网络模型;其中,大模型引导分割网络模型包括大模型优化模块和多任务图像处理模块;大模型优化模块用于对输入图像进行分割与过滤,得到接近真实场景标签的分割掩码,作为引导信息;多任务图像处理模块用于提取输入图像的特征图,并融合所述引导信息,实现图像分割;采用预设类型的图像集对构建的大模型引导分割网络模型进行训练;利用训练好的大模型引导分割网络模型得到待分割图像的图像分割结果。采用本发明的方案,可使模型能够利用大模型的良好分割结果进行引导;同时减少模型对数据标签的依赖,从而增强模型的泛化性能。

    一种多模块级联的水下图像增强方法

    公开(公告)号:CN114612347B

    公开(公告)日:2022-08-16

    申请号:CN202210506856.0

    申请日:2022-05-11

    Abstract: 本发明提供一种多模块级联的水下图像增强方法,属于计算机视觉技术领域。所述方法包括:将现有的空气图像增强网络与颜色校正网络级联,构建多模块级联增强网络,其中,空气图像增强网络用于解决水下图像中与空气图像相似的退化问题,颜色校正网络用于校正水下图像中存在的色偏;获取成对水下图像数据集,利用获取的成对水下图像数据集训练所述多模块级联增强网络;获取待增强的水下图像,将待增强的水下图像送入训练好的多模块级联增强网络,得到增强后的水下图像。采用本发明,能够解决水下成像中不同类型的退化问题。

    基于深度学习的高温合金微观组织图像分割方法及装置

    公开(公告)号:CN114119627A

    公开(公告)日:2022-03-01

    申请号:CN202111216114.6

    申请日:2021-10-19

    Abstract: 本发明公开了一种基于深度学习的高温合金微观组织图像分割方法及装置,该方法包括:获取待分割图像,并对所述待分割图像进行图像特征提取;基于改进的SNL模块,对提取到的图像特征进行注意力机制提取融合,得到所述待分割图像对应的特征图;基于得到的特征图,实现高温合金微观组织结构图像分割。与传统图像处理方法对比,本发明的分割精度大幅度提升,甚至受到噪声污染的图像也能获取良好的分割效果,与UNet网络结构相比,本发明解决了感受野过于局部,注意机制过于单一的问题的同时,分割效果也明显提升。

    一种基于大模型引导的图像分割方法

    公开(公告)号:CN118298169B

    公开(公告)日:2024-10-25

    申请号:CN202410236797.9

    申请日:2024-03-01

    Abstract: 本发明公开了一种基于大模型引导的图像分割方法,属于图像处理与计算机视觉技术领域,该方法包括:构建大模型引导分割网络模型;其中,大模型引导分割网络模型包括大模型优化模块和多任务图像处理模块;大模型优化模块用于对输入图像进行分割与过滤,得到接近真实场景标签的分割掩码,作为引导信息;多任务图像处理模块用于提取输入图像的特征图,并融合所述引导信息,实现图像分割;采用预设类型的图像集对构建的大模型引导分割网络模型进行训练;利用训练好的大模型引导分割网络模型得到待分割图像的图像分割结果。采用本发明的方案,可使模型能够利用大模型的良好分割结果进行引导;同时减少模型对数据标签的依赖,从而增强模型的泛化性能。

Patent Agency Ranking