一种面向机器视觉的图像编码、解码和压缩方法及系统

    公开(公告)号:CN119011858A

    公开(公告)日:2024-11-22

    申请号:CN202411009925.2

    申请日:2024-07-26

    Abstract: 本发明公开一种面向机器视觉的图像编码、解码和压缩方法及系统,包括:通过空频调制编码网络获得待编码图像的第一特征图;将所述第一特征图中的每个特征值量化为整数,得到第二特征图;将所述第二特征图的分布参数化建模为高斯分布,采用熵模型预测高斯分布的均值、方差;根据预测的所述高斯分布的均值、方差对第二特征图的特征进行概率估计,根据估计概率进行算术编码,获得压缩图像二进制码流。本发明可以高效提取面向机器视觉的下游任务更为需要的信息,减少对于机器视觉冗余的信息,能够降低图像压缩码率开销的同时,有效提升下游任务的精确度,且能够运用于现有的任一端到端图像压缩编解码网络和熵模型网络。

    基于上下文强化学习的码率自适应方法及控制器构建方法

    公开(公告)号:CN117692644A

    公开(公告)日:2024-03-12

    申请号:CN202211030945.9

    申请日:2022-08-26

    Abstract: 本发明提供一种基于上下文强化学习的码率自适应方法及控制器构建方法,包括:构建以网络吞吐上下文信息为输入、当前网络动态隐变量表示为输出的网络动态编码器;构建以用户端信息和所述当前网络动态隐变量表示为输入、当前视频切片的最优码率版本为输出的码率自适应元策略网络;对所述网络动态编码器和码率自适应元策略网络组成的全局模型通过行为克隆方法进行预训练、利用基于互信息正则化的近端策略优化方法进行再训练;获得最优神经网络参数,基于异构的用户端,对神经网络参数微调,获得码率自适应控制器。本发明能够快速自适应异构用户的本地网络带宽环境,从而最大化用户的整体观看体验质量,提高了网络视频流传输的带宽利用率和鲁棒性。

    图像压缩差错检测方法及抗差错的图像压缩方法、系统

    公开(公告)号:CN117036755A

    公开(公告)日:2023-11-10

    申请号:CN202310937298.8

    申请日:2023-07-28

    Abstract: 本发明提供一种图像压缩差错检测方法,包括:获取训练图像数据集;采用图像压缩模型提取所述训练图像的第一隐特征表示,所述第一隐特征表示是用于图像压缩的多通道隐特征表示;对所述第一隐特征表示进行处理,得到用于检测图像压缩差错的稳定性度量区域;提取测试图像的第一隐特征表示,将所述测试图像的第一隐特征表示与所述稳定性度量区域进行比较,得到图像压缩差错检测结果。在此图像压缩差错检测方法基础上,对应提供一种抗差错的图像压缩方法、系统。本发明可高效地检测基于神经网络的图像压缩产生的质量差错和损坏,高效地实现稳定的连续图像压缩,适用实际的图像通信场景。

    可变码率图像压缩方法、系统、装置、终端及存储介质

    公开(公告)号:CN115988215A

    公开(公告)日:2023-04-18

    申请号:CN202211605816.8

    申请日:2022-12-12

    Abstract: 本发明提供一种可变码率图像压缩方法、系统、装置、终端及存储介质,包括:待编码图像通过第一分解变换神经网络获得初始特征图;通过死区量化器对初始特征图量化获得量化特征图;利用熵模型对量化特征图及超先验信息进行熵编码获得压缩码流;对压缩码流进行熵解码,利用熵模型恢复量化的超先验信息及量化特征图;反量化量化特征图获得重构特征图;将重构特征图通过第一合成变换神经网络获得重构图像;根据目标码率或目标失真,对编码过程中的量化以及反量化的参数进行调整,使压缩码流的码率接近目标码率,或使重构图像的失真接近目标失真。本发明提供准确的码率控制方案,使压缩码流码率更好地适配动态网络带宽变化,具有极强的实际应用价值。

    一种视频染色方法、压缩方法、系统及电子设备

    公开(公告)号:CN114862712A

    公开(公告)日:2022-08-05

    申请号:CN202210474083.2

    申请日:2022-04-29

    Abstract: 本发明提供一种视频染色方法,包括:使用神经网络从参考帧与目标帧的灰度信息中提取多层特征图;基于所述多层特征图进行光流预测和光流优化;利用光流优化获得的结果将所述参考帧中的颜色传播到所述目标帧上。本发明改善了光流长时预测的准确率,所生成的彩色视频帧保真度更优、色彩更加准确,具有极强的实际应用价值。应用在视频编码任务上,可以在保持重构质量的前提下达到减少码率的效果。

    基于上下文重组建模的图像编码、解码方法及压缩方法

    公开(公告)号:CN113747163A

    公开(公告)日:2021-12-03

    申请号:CN202110940403.4

    申请日:2021-08-17

    Abstract: 本发明提供一种基于上下文重组建模的图像编码、解码方法及压缩方法,其中,采用第一卷积神经网络生成图像的多通道特征图,作为第一特征图;对第一特征图按照通道间相似性分组,重新排列特征通道,输出重组的多通道特征图,作为第二特征图,输出通道索引二进制码流;将第二特征图量化为整数;根据量化后的第二特征图,提取超先验信息,获取超先验信息二进制码流;生成重构超先验信息,利用重构的超先验信息及量化后的第二特征图的上下文信息,获得特征图二进制码流;合并上述三种码流,得到压缩图像二进制码流。本发明可更高效地利用特征图中通道的相关性,通过控制通道分组的组别数在可降低性能的条件下提高编解码效率。

    适用于机器人自适应不同任务的双重鲁棒增强的控制方法

    公开(公告)号:CN117301068A

    公开(公告)日:2023-12-29

    申请号:CN202311501158.2

    申请日:2023-11-10

    Abstract: 本发明提供了一种适用于机器人自适应不同任务的双重鲁棒增强的控制方法,其基于元强化学习在具有不同目标和潜在动力学的机器人控制任务上采样机器人控制过程中的信号用于训练,同时考虑将各个任务上的控制信号用其他任务上的奖励函数进行重标注来增强训练数据集,采用双重鲁棒估计的方法估计重标注后信号的状态价值,最终实现机器人能够通过少量采样自适应解决具有不同目标或不同潜在动力学的机器人控制任务。本发明解决了机器人控制任务中,在不同任务场景下同时存在目标和潜在动力学不同,且存在奖励信号稀疏的问题,增强了机器人控制方法对于不同环境和任务目标的适应能力,为机器人提供了性能更好的控制方法。

    基于条件扩散的概率熵建模图像编码、解码、压缩方法

    公开(公告)号:CN117119204A

    公开(公告)日:2023-11-24

    申请号:CN202311084166.1

    申请日:2023-08-25

    Abstract: 本发明公开一种基于条件扩散的概率熵建模图像编码、解码、压缩方法,包括:获取待编码图像的第一特征图和第二特征图;获取第二特征图的超先验特征二进制码流以及超先验信息;将第二特征图划分为多个通道分组,将每个通道分组划分为两个空间分组;将每个空间分组的分布参数化建模为混合高斯分布,通过条件扩散从高斯噪声逐次采样预测混合高斯分布的均值、方差和权重;根据混合高斯分布对第二特征图进行概率估计,并进行算术编码,获得每个空间分组的特征二进制码流并合并为特征二进制码流,进一步与超先验特征二进制码流合并,得到压缩图像二进制码流。本发明可以更精确地对三维特征的分布进行建模和估计码率,提升图像压缩的率失真性能。

    基于上下文重组建模的图像编码、解码方法及压缩方法

    公开(公告)号:CN113747163B

    公开(公告)日:2023-09-26

    申请号:CN202110940403.4

    申请日:2021-08-17

    Abstract: 本发明提供一种基于上下文重组建模的图像编码、解码方法及压缩方法,其中,采用第一卷积神经网络生成图像的多通道特征图,作为第一特征图;对第一特征图按照通道间相似性分组,重新排列特征通道,输出重组的多通道特征图,作为第二特征图,输出通道索引二进制码流;将第二特征图量化为整数;根据量化后的第二特征图,提取超先验信息,获取超先验信息二进制码流;生成重构超先验信息,利用重构的超先验信息及量化后的第二特征图的上下文信息,获得特征图二进制码流;合并上述三种码流,得到压缩图像二进制码流。本发明可更高效地利用特征图中通道的相关性,通过控制通道分组的组别数在可降低性能的条件下提高编解码效率。

Patent Agency Ranking