图像处理方法、装置、电子设备及存储介质

    公开(公告)号:CN119450056A

    公开(公告)日:2025-02-14

    申请号:CN202411579152.1

    申请日:2024-11-06

    Abstract: 本公开提供了一种图像处理方法、装置、电子设备及存储介质,涉及视觉技术领域。该图像处理方法包括:对待处理图像进行视觉识别,获得待处理图像的前景图像区域;将待处理图像中除前景图像区域之外的区域确定为待处理图像的背景图像区域;对背景图像区域进行动态窗口平滑处理,获得待处理图像对应的预处理图像;对预处理图像进行图像编解码处理,获得编解码处理后的图像;基于任务网络对编解码处理后的图像进行处理,获得待处理图像的任务结果。该方法能够降低不感兴趣区域的信息量,在提升压缩比的同时,增强感兴趣区域与不感兴趣区域之间的对比度,对后续任务的精度影响较小。

    锚框超参数设置方法及装置、存储介质及电子设备

    公开(公告)号:CN119091171A

    公开(公告)日:2024-12-06

    申请号:CN202411179553.8

    申请日:2024-08-26

    Abstract: 本公开提供了一种锚框超参数设置方法及装置、存储介质及电子设备,涉及计算机技术领域。该方法包括,获取目标数据集,其中,目标数据集包括多个类别的样本;根据预设的第一聚类算法对目标数据集中的每个类别的样本进行分组,确定多个分组样本;根据预设的第二聚类算法对每个分组样本的目标框的尺寸进行聚类,确定每个分组样本的聚类结果;根据每个分组样本的聚类结果,确定目标数据集的锚框超参数。本公开通过第一聚类算法进行数据集分组结合第二聚类算法对目标框进行聚类分析,使得聚类结果对各类样本的兼顾更加均衡。

    图像字符重建模型的训练方法、装置、介质及电子设备

    公开(公告)号:CN119942559A

    公开(公告)日:2025-05-06

    申请号:CN202411998187.9

    申请日:2024-12-31

    Abstract: 本申请公开了图像字符重建模型的训练方法、装置、介质及电子设备,该方法包括:获取图像字符重建模型的预处理图像;将预处理图像输入待联合训练编解码器模型,得到适配器输出特征和字符识别中间特征;待联合训练编解码器模型能实现提升图像压缩;基于适配器输出特征和字符识别中间特征的第一联合损失函数,以及编解码器的原始训练损失函数,对待联合训练编解码器模型进行训练;获取训练好的编解码器的解码特征;基于解码特征和字符识别中间特征对图像重建模块进行图像重建训练,可以在重建图像上融合具有完整文字信息的字符识别中间特征,补全重建图像上因解码过程中过滤掉的图像背景文字信息,提高重建图像的文字信息质量。

    模型训练方法、目标检测方法及装置、设备和产品

    公开(公告)号:CN119600304A

    公开(公告)日:2025-03-11

    申请号:CN202411644456.1

    申请日:2024-11-15

    Abstract: 本公开是关于一种模型训练方法、目标检测方法及装置、设备和产品,涉及计算机视觉技术领域。该方法包括:获取训练图像集,通过初始适配器网络对多个训练图像进行特征提取处理,得到第一图像特征;获取初始目标检测模型;由头部检测模型对多个训练图像进行特征提取处理,得到第二图像特征;基于第一图像特征与第二图像特征确定特征损失值并对初始适配器网络进行训练,得到适配器网络;根据适配器网络与主体检测模型,构建目标检测模型。本公开将适配器转换解码特征作为目标检测模型的输入,只需很小的代价就可以训练一个低复杂度的适配器网络,无需重新训练大参数量的目标检测模型,可以大量减少训练过程中的显存占用。

    编解码模型的训练方法及装置和图像处理方法及装置

    公开(公告)号:CN119052511A

    公开(公告)日:2024-11-29

    申请号:CN202310612480.6

    申请日:2023-05-29

    Abstract: 本申请涉及一种编解码模型的训练方法及装置、图像处理方法及装置、计算机设备、存储介质和计算机程序产品。所述方法包括:将训练样本图像输入至编解码模型,获得编码码流和解码特征;将解码特征输入机器视觉任务网络,获得骨干网络输出的第一特征信息,并将训练样本图像输入机器视觉任务网络,获得骨干网络输出的第二特征信息;根据第一特征信息、第二特征信息、编码码流、解码特征、训练样本图像和目标损失函数对编解码模型进行迭代训练,得到训练后的编解码模型;目标损失函数包含用于表征第一特征信息和第二特征信息的差异的任务特征损失函数。采用本方法得到的编解码模型处理图像后能够提高机器视觉任务执行准确度。

    一种基于自适应阈值分割的特征编码方法、装置及设备

    公开(公告)号:CN117372716A

    公开(公告)日:2024-01-09

    申请号:CN202210770963.4

    申请日:2022-06-30

    Inventor: 薛俊达

    Abstract: 本发明实施例提供了一种基于自适应阈值分割的特征编码方法、装置及设备,其中,所述方法包括:获取对目标图像进行特征提取得到的第一浮点特征,其中,所述第一浮点特征包含多个特征值;对所述第一浮点特征中各特征值进行统计分析,确定所述第一浮点特征对应的特征分割阈值;将所述第一浮点特征中绝对值小于所述特征分割阈值的特征值赋值为零,得到阈值分割后的第二浮点特征;对所述第二浮点特征进行编码,得到所述目标图像对应的码流,实现了轻量化特征编码,提高了特征编码的压缩比。

    面向机器视觉的编码及视频补帧方法、装置、设备及介质

    公开(公告)号:CN118803271A

    公开(公告)日:2024-10-18

    申请号:CN202310403841.6

    申请日:2023-04-14

    Abstract: 本公开提供了一种面向机器视觉的编码及视频补帧方法、装置、设备及介质,涉及机器视觉数据通信中信号编解码技术领域。面向机器视觉编码的视频补帧方法包括:对编码端的码流数据进行解码,得到多个视频帧图像,所述多个视频帧图像包含面向机器视觉的神经网络编码图像与非面向机器视觉的神经网络编码图像;结合编码参数,对面向机器视觉的神经网络编码图像与非面向机器视觉的神经网络编码图像分别采用不同的补帧方法进行补帧。根据本公开实施例,能够有效缓解面向机器视觉的神经网络编码在视频补帧中容易造成补帧图像失真的问题。

    图像编码方法、图像解码方法及相关设备

    公开(公告)号:CN118803242A

    公开(公告)日:2024-10-18

    申请号:CN202310403385.5

    申请日:2023-04-14

    Abstract: 本公开提供了一种图像编码方法、图像解码方法及相关设备,涉及图像编解码技术领域。其中,图像编码方法包括:获取待编码的图像数据,图像数据包括:一帧或多帧图像;将每帧图像输入预先训练好的图像特征提取模型中,输出每帧图像的通用特征数据和内容相关特征数据,通用特征数据为针对不同帧图像提取的静态特征数据;内容相关特征数据为针对不同帧图像提取的动态特征数据;对每帧图像的通用特征数据和内容相关特征数据进行编码,得到编码结果。本公开能够在降低图像编码码率的情况下,有效提高图像恢复精度。对图像的通用特征数据和内容相关特征数据进行编码,能够减少编码压缩的数据量。

    图像下采样方法及装置、计算机可读存储介质

    公开(公告)号:CN117853325A

    公开(公告)日:2024-04-09

    申请号:CN202211198475.7

    申请日:2022-09-29

    Abstract: 本公开涉及图像下采样方法及装置、计算机可存储介质,涉及图像处理领域。图像下采样方法包括:将图像分为在第一方向上的多个子图;对第一方向上的多个子图进行卷积;将卷积后的第一方向上的多个子图进行拼接,得到在第一方向为第一目标尺寸的第一下采样图像;将第一下采样图像分为在第二方向上的多个子图;对第二方向上的多个子图进行卷积;将卷积后的第二方向上的多个子图进行拼接,得到在第一方向为第一目标尺寸、在第二方向为第二目标尺寸的第二下采样图像。根据本公开,实现了图像不同方向的尺寸的自由缩减。

Patent Agency Ranking