-
公开(公告)号:CN116778254A
公开(公告)日:2023-09-19
申请号:CN202310825795.9
申请日:2023-07-06
申请人: 中国电信股份有限公司技术创新中心 , 中国电信股份有限公司
IPC分类号: G06V10/764 , G06V10/40 , G06V10/82 , G06N3/0464 , G06N3/082
摘要: 本申请实施例提供了一种图像分类模型生成方法、装置、设备及存储介质,涉及人工智能技术领域,该方法包括:先采用带有预设标签的待分类图像对图像分类模型进行训练,在至少一次训练结束后,针对任一特征提取层,从特征提取层的多个掩码矩阵中,获取特征提取层对应的失活掩码矩阵,其中,失活掩码矩阵用于指示特征提取层中不参与后续训练的掩码矩阵,可以降低模型训练的复杂度,提高模型训练效率。在训练结束后,针对任一特征提取层,基于特征提取层对应的失活掩码矩阵,从特征提取层删除失活掩码矩阵对应的滤波器,从而得到训练好的图像分类模型,而不用再进行图像分类模型的微调,可以进一步提高模型训练效率,提高模型剪枝效率。
-
公开(公告)号:CN118828010A
公开(公告)日:2024-10-22
申请号:CN202310431267.5
申请日:2023-04-20
申请人: 中国电信股份有限公司
摘要: 本公开提供一种基于机器视觉模型的编码解码器训练方法、装置及设备,涉及计算机技术领域,该方法具体包括:通过机器视觉模型输出的机器视觉模型特征,得到机器视觉模型特征的均方误差损失,通过编码解码器的原始均方误差损失,和机器视觉模型特征的均方误差损失的加权和,对编码解码器进行训练。利用机器视觉模型特征对编码解码器的联合训练,对编码解码器的训练过程进行反向传播,可以提升编码解码器和机器视觉模型之间的匹配度,以此提升已训练的编码解码器的输出在机器视觉模型中执行智能任务时的精度。
-
公开(公告)号:CN118827955A
公开(公告)日:2024-10-22
申请号:CN202310436411.4
申请日:2023-04-21
申请人: 中国电信股份有限公司
IPC分类号: H04N17/00 , H04N21/234 , H04N21/44
摘要: 本公开提供了一种I帧重建方法、装置、设备及存储介质。涉及通信编码领域,通过获取I帧编码后的编码特征,然后将编码特征输入特征与的帧内人眼视频模型,以使特征域的帧内人眼视频模型对编码特征进行解码以及人眼适配图像重建,得到重建后的I帧,可以使得重建后的I帧更加能够满足人眼视觉需求,使得基于重建后的I帧生成到的重建视频的视频质量较高,在用户观看视频时,可以提高用户观看视频的体验。
-
公开(公告)号:CN118803267A
公开(公告)日:2024-10-18
申请号:CN202310403893.3
申请日:2023-04-14
申请人: 中国电信股份有限公司
IPC分类号: H04N19/51 , H04N19/137 , H04N5/14
摘要: 本公开提供了一种面向机器视觉的运动估计方法,涉及机器视觉数据通信中信号编码技术领域。该方法包括:获取从视频序列中抽帧得到的第一图像帧和第二图像帧,确定目标对象在第一图像帧内的边界框;确定第一图像帧的边界框内的有效角点;根据第一图像帧的边界框内的有效角点,确定目标对象在第一图像帧与第二图像帧之间的移动距离;根据目标对象在第一图像帧与第二图像帧之间的移动距离,确定目标对象在第一图像帧与第二图像帧之间的移动速度;根据目标对象在第一图像帧与第二图像帧之间的移动速度,确定目标对象的运动估计值。本发明提升了运动估计的精准度。
-
公开(公告)号:CN115147500B
公开(公告)日:2024-06-28
申请号:CN202110339533.2
申请日:2021-03-30
申请人: 中国电信股份有限公司
IPC分类号: H04N19/136 , H04N19/146 , H04N19/17 , G06T9/00 , G06N3/0464 , G06N3/08
摘要: 本公开涉及一种图像特征的传输方法、装置和系统,涉及通信技术领域。该传输方法包括:利用机器学习模型,提取待处理图像对于各通道的特征矩阵;根据各特征矩阵之间的相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对;根据信息量大小,在各关联矩阵对的两个特征矩阵中确定表征矩阵和被表征矩阵;确定各表征矩阵与各被表征矩阵的对应关系;将各表征矩阵、对应关系、各被表征矩阵中的最大特征值和最小特征值进行量化处理和编码处理后,传输给译码端。
-
公开(公告)号:CN118057815A
公开(公告)日:2024-05-21
申请号:CN202211449877.X
申请日:2022-11-18
申请人: 中国电信股份有限公司
IPC分类号: H04N19/587 , H04N19/51
摘要: 本公开提供了一种图像序列抽帧处理方法、视频编码和解码方法及相关设备,涉及机器视觉技术领域。该方法包括:获取图像序列,其中,图像序列中包含:目标对象在移动过程中的多帧图像;确定图像序列中符合预设条件的目标对象数量和/或图像序列的移动速度;根据图像序列中符合预设条件的目标对象数量和/或图像序列的移动速度,确定对图像序列进行抽帧处理的抽帧参数信息。本公开能够实现对图像/视频序列的自适应抽帧编码,可以应用于各种面向机器视觉的图像/视频编码。
-
公开(公告)号:CN117934639A
公开(公告)日:2024-04-26
申请号:CN202211255737.9
申请日:2022-10-13
申请人: 中国电信股份有限公司
IPC分类号: G06T9/00
摘要: 本公开提供了一种红外图像处理方法、装置、电子设备及存储介质,涉及人工智能技术领域,具体方法如下:根据待压缩红外图像中每个像素点的像素值,以及第一预设数值,确定待压缩红外图像的掩膜像素阈值,将待压缩红外图像中像素值小于或者等于掩膜像素阈值的区域作为掩膜区域,并将掩膜区域中的信号值量化为第二预设数值,得到掩膜图像,将待压缩红外图像中,与掩膜图像的掩膜区域对应的区域转换为量化死区,得到掩膜红外图像,并对掩膜红外图像进行编码压缩处理得到无格式压缩码流文件。通过上述方式,可以有效降低压缩码流,增加压缩比,扩大量化死区,并提高执行智能任务时的精度。
-
公开(公告)号:CN117649353A
公开(公告)日:2024-03-05
申请号:CN202210995243.8
申请日:2022-08-18
申请人: 中国电信股份有限公司
IPC分类号: G06T5/70 , G06T7/11 , G06N3/0464
摘要: 本公开提供了一种图像处理方法、图像处理装置、计算机可读存储介质和电子设备,涉及图像处理技术领域。该图像处理方法包括:提取待处理图像的图像特征;对图像特征中的噪声区域进行剪裁处理,得到中间图像特征;对中间图像特征进行图像重建,得到降噪后的目标图像。本公开提供的技术方案,解决了传统方法中存在的图像重建模型复杂度高且图像重建效率低的技术问题,达到了提高图像重建效率以及降低图像重建模型的复杂度的技术效果。
-
公开(公告)号:CN116567238A
公开(公告)日:2023-08-08
申请号:CN202210101321.5
申请日:2022-01-27
申请人: 中国电信股份有限公司
IPC分类号: H04N19/13
摘要: 本公开提供了一种编解码方法、装置、电子设备及存储介质,涉及数据处理技术领域。该方法包括:根据待编码数据的最大值生成配置数据集;根据待编码数据与所述配置数据集内元素之间的大小关系,采用截断一元码对待编码数据进行二值化,得到第一二进制比特流和已编码数据base;根据base计算待编码数据的余数bias,对bias进行二值化,得到第二二进制比特流;依次输出第一二进制比特流和第二二进制比特流,以得到待编码数据对应的二进制比特流。本公开提供的一种编解码方法、装置、电子设备及存储介质,能够得到更短的二进制比特流,更多的MPS符号占比,提高压缩比,编码方式更简单。
-
公开(公告)号:CN116418997A
公开(公告)日:2023-07-11
申请号:CN202111624085.7
申请日:2021-12-28
申请人: 中国电信股份有限公司
IPC分类号: H04N19/42 , H04N19/124 , H04L1/24 , G06N3/0464
摘要: 本公开提供了一种特征数据压缩方法、装置、系统、电子设备及存储介质,涉及数据处理技术领域。该方法包括:将图像或视频数据输入到二值化特征提取网络,输出图像或视频数据的二值化特征数据;对二值化特征提取网络输出的二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据。本公开直接从图像或视频数据中提取出二值化的特征数据,无需在二进制算术编码时对特征数据进行量化处理,可简化数据压缩时的编码流程,减少编码计算量和数据量。
-
-
-
-
-
-
-
-
-