一种多模块级联的水下图像增强方法

    公开(公告)号:CN114612347B

    公开(公告)日:2022-08-16

    申请号:CN202210506856.0

    申请日:2022-05-11

    Abstract: 本发明提供一种多模块级联的水下图像增强方法,属于计算机视觉技术领域。所述方法包括:将现有的空气图像增强网络与颜色校正网络级联,构建多模块级联增强网络,其中,空气图像增强网络用于解决水下图像中与空气图像相似的退化问题,颜色校正网络用于校正水下图像中存在的色偏;获取成对水下图像数据集,利用获取的成对水下图像数据集训练所述多模块级联增强网络;获取待增强的水下图像,将待增强的水下图像送入训练好的多模块级联增强网络,得到增强后的水下图像。采用本发明,能够解决水下成像中不同类型的退化问题。

    一种基于扩散模型的电极板短路检测方法

    公开(公告)号:CN119671955A

    公开(公告)日:2025-03-21

    申请号:CN202411705503.9

    申请日:2024-11-26

    Abstract: 本发明公开了一种基于扩散模型的电极板短路检测方法,属于电极板短路检测技术领域,其包括:获取电极板的红外图像及显著图,构建样本数据集;将扩散模型引入电极板短路检测,在基于扩散模型的目标检测框架中添加显著性感知的特征增强分支和全局特征微调模块,构建检测模型;其中,显著性感知的特征增强分支用于引入显著图特征来增强红外图像特征;全局特征微调模块用于对图像特征进行微调,以获得与目标相关的上下文背景信息;对检测模型进行训练;利用训练好的模型对待检测的电极板进行检测。本发明可提取更高质量、更加丰富全面的目标特征,从而提高检测精度。

    一种基于大模型引导的图像分割方法

    公开(公告)号:CN118298169B

    公开(公告)日:2024-10-25

    申请号:CN202410236797.9

    申请日:2024-03-01

    Abstract: 本发明公开了一种基于大模型引导的图像分割方法,属于图像处理与计算机视觉技术领域,该方法包括:构建大模型引导分割网络模型;其中,大模型引导分割网络模型包括大模型优化模块和多任务图像处理模块;大模型优化模块用于对输入图像进行分割与过滤,得到接近真实场景标签的分割掩码,作为引导信息;多任务图像处理模块用于提取输入图像的特征图,并融合所述引导信息,实现图像分割;采用预设类型的图像集对构建的大模型引导分割网络模型进行训练;利用训练好的大模型引导分割网络模型得到待分割图像的图像分割结果。采用本发明的方案,可使模型能够利用大模型的良好分割结果进行引导;同时减少模型对数据标签的依赖,从而增强模型的泛化性能。

    一种两阶段追踪方法及装置

    公开(公告)号:CN118115913B

    公开(公告)日:2024-09-27

    申请号:CN202410204210.6

    申请日:2024-02-23

    Abstract: 本发明涉及深度学习计算机视觉领域目标追踪领域,特别是指一种两阶段追踪方法及装置,方法包括:获取待进行目标追踪的视频数据,根据视频数据获取图像对;构建基础追踪模型,采用双向视觉引导训练方法、视频序列微调方法以及目标层级的随机擦除数据增强方法,对基础追踪模型进行训练,得到训练好的追踪模型;根据图像对以及训练好的追踪模型,得到目标追踪结果。本发明提出了一种两阶段的训练方式,能够在有效利用视频序列信息的同时不增加任何推理成本。除此之外,本发明提出了一种目标层级的随机擦除数据增强方案,能够很好模拟在追踪过程中出现的遮挡问题,使训练的追踪器更加鲁棒。

    一种基于扩散模型的图像去模糊方法

    公开(公告)号:CN116645287B

    公开(公告)日:2024-03-29

    申请号:CN202310578005.1

    申请日:2023-05-22

    Abstract: 本发明公开了一种基于扩散模型的图像去模糊方案,属于图像处理技术领域。所述方法包括:构建DMDIFF去模糊网络模型;其中,所述DMDIFF去模糊网络包括模糊图像特征编码器、深度梯度提取UNet骨干网络和交叉注意力子网络;对训练样本图像进行数据增强处理,得到目标训练样本;通过所述目标训练样本训练所述DMDIFF去模糊网络模型,得到目标扩散模型;将待处理图像输入所述目标扩散模型进行去模糊处理,生成目标图像。本方案基于扩散模型学习差值模板,重点学习图像中的高频信息,避免了GAN、VAE等生成模型训练困难、去模糊结果呈现平滑的问题。

    一种层级敏感的图像特征聚合方法

    公开(公告)号:CN116452931B

    公开(公告)日:2024-03-19

    申请号:CN202310382755.1

    申请日:2023-04-11

    Abstract: 本发明公开了一种层级敏感的图像特征聚合方法,包括:在Transformer网络中加入局部自适应特征聚合模块和语义信息聚合模块,构建出层次结构敏感的特征聚合框架;其中,所述特征聚合框架包括三次特征聚合过程,且在三次特征聚合过程中分别采用了不同的聚合方案;将待处理的图像输入所述特征聚合框架中进行特征聚合,得到特征图像。本发明可使Transformer建立更准确的全局关系,并在图像分类、目标检测、语义分割等多个任务上取得更好的效果。

    一种基于多证据融合选取训练样本的特征提取方法及装置

    公开(公告)号:CN116664867A

    公开(公告)日:2023-08-29

    申请号:CN202310582786.1

    申请日:2023-05-22

    Abstract: 本发明公开了一种基于多证据融合选取训练样本的特征提取方法及装置,该方法包括:在特征提取网络的训练阶段引入多种不同的图像检索算法;对特征提取网络进行训练;训练过程包括:在输入图像中确定锚点、正样本点和负样本点;分别利用每一图像检索算法计算锚点和正样本点之间的正样本相似度,以及锚点与负样本点之间的负样本相似度;基于计算出的正样本相似度和负样本相似度更新负样本点,得到更新后的负样本点;将利用多种不同的图像检索算法所得到的更新后的负样本点进行融合,计算损失函数;利用训练好的特征提取网络对待处理图像进行特征提取,得到提取结果。本发明可提高描述子可靠性,进而提高匹配准确率和数量,有利于视觉定位等下游任务。

    一种基于轻量结构化线地图的视觉定位方法

    公开(公告)号:CN116662600A

    公开(公告)日:2023-08-29

    申请号:CN202310678818.8

    申请日:2023-06-08

    Abstract: 本发明公开了一种基于轻量结构化线地图的视觉定位方法,包括:通过图像检索,将查询图像与数据库图像进行图像匹配,根据图像匹配结果,找到与查询图像最相似的多个数据库图像,作为候选数据库图像;构建用于视觉定位的线地图;对所述查询图像和所述候选数据库图像进行线提取和匹配,构建二维到三维的线对应关系;基于构建的二维到三维的线对应关系,求解初始姿态;对求解出的初始姿态进行姿态迭代优化,得到最终的相机位姿。本发明可在较低的内存消耗下估计出较好的相机六自由度位姿,具有重大的应用前景和价值。

    基于点云-体素的几何自适应点云分类和分割方法及装置

    公开(公告)号:CN116452866A

    公开(公告)日:2023-07-18

    申请号:CN202310349933.0

    申请日:2023-04-04

    Abstract: 本发明提供一种基于点云‑体素的几何自适应点云分类和分割方法及装置,属于计算机视觉技术领域。所述方法包括:构建基于体素的深度卷积算子和基于点的位置自适应池化算子;根据构建的深度卷积算子和位置自适应池化算子,构建基于点云‑体素的特征提取模块,自适应地提取和融合输入点云中不同尺度的特征;根据构建的特征提取模块,构建基于点云‑体素的几何自适应网络;输入点云分类数据集和点云部件分割数据集对构建的几何自适应网络进行训练,利用训练好的几何自适应网络实现点云的形状分类和部件分割任务。采用本发明,能够提高点云形状分类和部件分割的精度并具有高效快速的特点。

    一种基于阶段性持续学习的可伸缩单流追踪方法

    公开(公告)号:CN116433727A

    公开(公告)日:2023-07-14

    申请号:CN202310691919.9

    申请日:2023-06-13

    Abstract: 本发明涉及视觉目标追踪技术领域,特别是指一种基于阶段性持续学习的可伸缩单流追踪方法。一种基于阶段性持续学习的可伸缩单流追踪方法包括:获取搜索图像以及模板图像,对搜索图像以及模板图像进行处理,获得输入图像;将输入图像进行特征向量化处理,获得向量化特征;基于向量化特征,通过交互窗口自注意力模块以及动态混合注意力模块,获得目标图像特征;根据目标图像特征,通过分类头以及回归头,获得输出图像;根据输出图像,在目标时序运动中进行目标追踪。本发明是一种基于阶段间持续学习具备优秀前后景区分能力的追踪方法。

Patent Agency Ranking