-
公开(公告)号:CN117709428A
公开(公告)日:2024-03-15
申请号:CN202311797315.9
申请日:2023-12-25
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06N3/08 , G06N3/045 , G06N3/0475 , G06N3/094 , G06V10/74 , G06V10/54 , G06T3/4053 , G06T3/4046
Abstract: 本公开提供了一种图像生成器的训练方法、图像重建方法、装置和存储介质,涉及图像处理领域。该训练方法包括:获取第一图像和第一图像降低分辨率后的第二图像;基于第一图像得到第一图像特征和第一图像对应的下采样图像特征,以及基于第二图像得到第二图像特征和第二图像对应的上采样图像特征;计算下采样图像特征与上采样图像特征的图像相似度;利用图像相似度,基于注意力机制,对第一图像特征和第二图像特征进行纹理处理,得到图像编码;将图像编码输入至图像生成器,生成分辨率高于第二图像的预测图像;以及基于预测图像与第一图像,利用损失函数对图像生成器进行训练。本公开能够提升图像高分辨率重建后的质量。
-
公开(公告)号:CN119850468A
公开(公告)日:2025-04-18
申请号:CN202411994437.1
申请日:2024-12-31
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
Abstract: 本申请涉及一种图像盲去模糊方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取待处理图像的语义掩码;通过训练完成的图像盲去模糊模型提取所述待处理图像的图像特征,将所述图像特征和所述语义掩码进行融合处理,得到融合特征;训练完成的图像盲去模糊模型是利用预训练的美学属性分布预测模型,对待训练的图像盲去模糊模型进行训练得到的;将所述融合特征和所述融合特征的图像特征进行多次融合处理,得到所述待处理图像的目标融合特征;对所述目标融合特征的图像特征进行图像重建处理,得到所述待处理图像的去模糊图像。采用本方法,能够提高去模糊图像的清晰度和美学质量。
-
公开(公告)号:CN119621933A
公开(公告)日:2025-03-14
申请号:CN202411688564.9
申请日:2024-11-22
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06F16/334 , G06F16/335 , G06N5/04
Abstract: 本公开实施例是关于一种检索增强生成方法及装置、计算机程序产品、电子设备,涉及人工智能技术领域,该方法包括:确定目标模型的输入集合,并将所述输入集合划分为训练集以及验证集;确定候选集合以及结果集合,并基于所述训练集确定所述候选集合中的每个元素的参数信息,以确定加入所述结果集合的元素;对所述结果集合中的每个元素基于所述验证集进行验证处理,确定目标检索结果数量;将所述目标检索结果数量对应的检索结果输入目标模型,生成输出结果。本公开能够准确地确定用于检索增强的目标检索结果数量,提高检索增强生成效果。
-
公开(公告)号:CN119600304A
公开(公告)日:2025-03-11
申请号:CN202411644456.1
申请日:2024-11-15
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本公开是关于一种模型训练方法、目标检测方法及装置、设备和产品,涉及计算机视觉技术领域。该方法包括:获取训练图像集,通过初始适配器网络对多个训练图像进行特征提取处理,得到第一图像特征;获取初始目标检测模型;由头部检测模型对多个训练图像进行特征提取处理,得到第二图像特征;基于第一图像特征与第二图像特征确定特征损失值并对初始适配器网络进行训练,得到适配器网络;根据适配器网络与主体检测模型,构建目标检测模型。本公开将适配器转换解码特征作为目标检测模型的输入,只需很小的代价就可以训练一个低复杂度的适配器网络,无需重新训练大参数量的目标检测模型,可以大量减少训练过程中的显存占用。
-
公开(公告)号:CN119599091A
公开(公告)日:2025-03-11
申请号:CN202411640210.7
申请日:2024-11-15
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06N3/096 , G06N3/0464 , G06N3/094 , G06N3/084 , G06F18/241 , G06F18/2415 , G06F18/213
Abstract: 本公开提供了一种领域自适应方法、领域自适应组件、电子设备及可读介质,属于计算机技术领域。该方法可以应用在预训练的初始模型,该初始模型在来源于合成域的第一样本上训练获得。获取该初始模型中第一特征提取模块从第二样本中提取的第一特征,该第二样本来源于自然域与合成域;进而可以根据该第一特征判断第二样本的来源域,以及基于来源域确定第一特征的对抗性损失绝对值,并以对抗性损失绝对值最大为目的在反向的过程中通过梯度反转更新第一特征提取模块。基于此,该方法能够实现特征提取的领域自适应,降低了对自然域样本数量与特征标签的需求,还能够灵活应对复杂模型的领域自适应需求,可以即插即用式灵活应用。
-
公开(公告)号:CN119484892A
公开(公告)日:2025-02-18
申请号:CN202410773493.6
申请日:2024-06-14
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: H04N21/2343 , H04N21/4402
Abstract: 本公开提供了一种面向机器视觉任务的视频编码方法、解码方法及相关设备,涉及机器视觉技术领域。该解码方法包括:对待解码视频码流进行解码,得到解码后的视频序列和时域采样信息;根据时域采样信息,对解码后的视频序列执行时域恢复处理。本公开能够在保证视觉任务的情况下,提高视频数据的传输效率。
-
公开(公告)号:CN119420937A
公开(公告)日:2025-02-11
申请号:CN202411537885.9
申请日:2024-10-30
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: H04N19/172 , H04N19/20
Abstract: 本公开实施例提供了一种基于光流的视频编码方法、装置、设备、介质及程序产品。该方法通过前向光流估计模块基于待预测视频帧前向的多个视频帧为参考帧,通过光流估计对其光流变化特征进行捕捉,并通过多轮循环处理的方式逐步逼近待预测视频帧的真实值,最终生成目标预测视频帧。该方法通过多轮次循环光流估计的方法,逐步逼近待预测视频帧的真实值,提供了预测估计的准确性。同时,仅基于前向的视频帧作为参考帧,避免了引入后向参考帧对编码效率产生的影响,满足了低时延时域编码模式的需求。
-
公开(公告)号:CN119052511A
公开(公告)日:2024-11-29
申请号:CN202310612480.6
申请日:2023-05-29
Applicant: 中国电信股份有限公司上海研究院 , 中国电信股份有限公司
IPC: H04N19/70
Abstract: 本申请涉及一种编解码模型的训练方法及装置、图像处理方法及装置、计算机设备、存储介质和计算机程序产品。所述方法包括:将训练样本图像输入至编解码模型,获得编码码流和解码特征;将解码特征输入机器视觉任务网络,获得骨干网络输出的第一特征信息,并将训练样本图像输入机器视觉任务网络,获得骨干网络输出的第二特征信息;根据第一特征信息、第二特征信息、编码码流、解码特征、训练样本图像和目标损失函数对编解码模型进行迭代训练,得到训练后的编解码模型;目标损失函数包含用于表征第一特征信息和第二特征信息的差异的任务特征损失函数。采用本方法得到的编解码模型处理图像后能够提高机器视觉任务执行准确度。
-
公开(公告)号:CN119450056A
公开(公告)日:2025-02-14
申请号:CN202411579152.1
申请日:2024-11-06
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: H04N19/167 , H04N19/136
Abstract: 本公开提供了一种图像处理方法、装置、电子设备及存储介质,涉及视觉技术领域。该图像处理方法包括:对待处理图像进行视觉识别,获得待处理图像的前景图像区域;将待处理图像中除前景图像区域之外的区域确定为待处理图像的背景图像区域;对背景图像区域进行动态窗口平滑处理,获得待处理图像对应的预处理图像;对预处理图像进行图像编解码处理,获得编解码处理后的图像;基于任务网络对编解码处理后的图像进行处理,获得待处理图像的任务结果。该方法能够降低不感兴趣区域的信息量,在提升压缩比的同时,增强感兴趣区域与不感兴趣区域之间的对比度,对后续任务的精度影响较小。
-
公开(公告)号:CN119091171A
公开(公告)日:2024-12-06
申请号:CN202411179553.8
申请日:2024-08-26
Applicant: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC: G06V10/762 , G06V10/80
Abstract: 本公开提供了一种锚框超参数设置方法及装置、存储介质及电子设备,涉及计算机技术领域。该方法包括,获取目标数据集,其中,目标数据集包括多个类别的样本;根据预设的第一聚类算法对目标数据集中的每个类别的样本进行分组,确定多个分组样本;根据预设的第二聚类算法对每个分组样本的目标框的尺寸进行聚类,确定每个分组样本的聚类结果;根据每个分组样本的聚类结果,确定目标数据集的锚框超参数。本公开通过第一聚类算法进行数据集分组结合第二聚类算法对目标框进行聚类分析,使得聚类结果对各类样本的兼顾更加均衡。
-
-
-
-
-
-
-
-
-