一种混合视频编解码系统中基于深度神经网络的帧间预测方法

    公开(公告)号:CN108833925A

    公开(公告)日:2018-11-16

    申请号:CN201810798399.0

    申请日:2018-07-19

    Abstract: 本发明提出了一种混合视频编解码系统中基于深度神经网络的帧间预测方法,属于帧间预测技术领域。所述方法通过借助当前块和参考块的周围相邻像素,利用深度神经网络获得一个更准确的预测块,从而使帧间预测性能得到提升。本发明的有益特点为,区别于基于传统帧间预测方法,本发明是基于深度神经网络的方法;区别于现有的仅针对于混合视频编解码系统中图像块本身作为输入的深度神经网络方法,本发明的深度神经网络输入是多个输入,包含非方形区域,这是区别于普通卷积神经网络的贡献所在。

    一种多视点视频编码中分量间的运动参数继承方法

    公开(公告)号:CN104469387B

    公开(公告)日:2017-11-03

    申请号:CN201410777486.X

    申请日:2014-12-15

    Abstract: 一种多视点视频编码中分量间的运动参数继承方法,涉及多视点视频编码领域。本发明是为了提升多视点视频的编码性能,减少多视点视频的传输带宽和存储空间。对于处于依赖视点中的当前块,获取所述当前块相对于视间参考帧的视差矢量;根据求出的所述视差矢量定位到当前块在视间参考帧中的对应块,用视间对应块中已经编码的运动信息预测当前块的运动信息;编码深度图时,用对应纹理图中与当前深度块具有相同位置的对应纹理块的运动信息预测当前深度块的运动信息。利用视间相关性提出视点间的运动参数继承方法,增强依赖视点的编码性能;利用深度图和对应纹理图间的相关性提出深度‑纹理间的运动参数继承方法,增强深度信息的编码性能。有效提高多视点视频的编码效率。

    混合视频编码标准中帧间预测方法

    公开(公告)号:CN104539967B

    公开(公告)日:2017-07-28

    申请号:CN201510020490.6

    申请日:2015-01-15

    Abstract: 混合视频编码标准中帧间预测方法,属于视频编码领域。为了解决如何在现有加权预测方案中增强鲁棒性的问题。一种混合视频编码标准中帧间预测方法,通过以下步骤实现:选定当前块,获取当前块的时域对应块作为当前块的预测块,选取当前块的空域邻近像素和时域对应块的空域邻近像素利用线性加权预测模型:y=ax+b,求出当前块的加权预测参数:加权因子a和附加的偏移b;式中,y表示当前块的空域邻近像素,x表示时域对应块的空域邻近像素;根据求出的加权因子a和附加的偏移b,利用步骤一的线性加权预测模型对预测块中的预测像素值进行处理,使处理后预测块与当前块接近;利用获得的处理后的预测块进行帧间预测。

    混合视频编码标准中帧内预测方法

    公开(公告)号:CN105491390A

    公开(公告)日:2016-04-13

    申请号:CN201510861669.4

    申请日:2015-11-30

    Abstract: 混合视频编码标准中的帧内预测方法,属于视频编码领域。本发明的目的是为了有效地处理视频序列中存在的复杂块,如由于物体或者摄像机运动导致的视频模糊,多方向的复杂块等,而提出一种混合视频编码标准中帧内预测方法,以进一步提升视频编码的性能。该帧内预测方法,利用两个不同的预测模式来得到两个不同的预测值。通过对这两个预测值进行加权得到当前编码块的一个新的预测。获取当前编码块的周围若干个相邻已编码块的帧内编码模式信息,选择其中一个模式为模式一;在模式一的基础上,选择另外一个帧内模式为模式二。利用两个不同预测模式合成的预测值,能够处理视频序列中的复杂块,从而使得编码效率得到进一步提高。

    一种多视点视频编码中的视差矢量获取方法

    公开(公告)号:CN104394417A

    公开(公告)日:2015-03-04

    申请号:CN201410777487.4

    申请日:2014-12-15

    Abstract: 一种多视点视频编码中的视差矢量获取方法,本发明涉及视差矢量获取方法。本发明解决解决依赖于当前帧中的当前块的空域邻近块,影响编码过程中的并行性以及得到的当前块的预测信息不够准确的问题而提出的一种多视点视频编码标准中的视差矢量获取方法。该方法是通过一、划分为L*W单元区域;二、划分为l*w的单元;三、利用视差矢量的均值、中值、最大值、最小值或者加权平均值获取L*W的单元区域的视差矢量;四、预测当前块的运动矢量;五、得到视间参考帧对应的视差信息;六、将步骤三获取的L*W单元区域的视差矢量用于加权模式中得到视间参考帧对应的视差信息;七、得到当前块的像素值等步骤实现的。本发明应用于视差矢量获取领域。

    插值依赖的图像自适应下采样方法

    公开(公告)号:CN102769745B

    公开(公告)日:2014-12-31

    申请号:CN201210206705.X

    申请日:2012-06-21

    Abstract: 插值依赖的图像自适应下采样方法,涉及图像及视频处理,解决了目前的下采样与上采样往往是独立的,而图像及视频的处理通常同时需要下采样和上采样的问题,它包括具体步骤如下:步骤一、对给定的输入图像,生成一幅下采样图像,对此下采样图像插值出上采样图像;步骤二、采用基于块的下采样方法,提高下采样图像的质量;步骤三、判断与内容是否无关;是,执行步骤四;否,执行步骤五;步骤四、与内容无关的下采样,插值系数组成插值矩阵,对插值过程求逆得到下采样图像;步骤五、与内容相关,给出初始系数,运用与内容无关的方法得到一幅初始的下采样图像,根据得到的图像训练出新的插值系数,然后再迭代得到下采样图像。用于图像及视频处理。

    插值依赖的图像自适应下采样方法

    公开(公告)号:CN102769745A

    公开(公告)日:2012-11-07

    申请号:CN201210206705.X

    申请日:2012-06-21

    Abstract: 插值依赖的图像自适应下采样方法,涉及图像及视频处理,解决了目前的下采样与上采样往往是独立的,而图像及视频的处理通常同时需要下采样和上采样的问题,它包括具体步骤如下:步骤一、对给定的输入图像,生成一幅下采样图像,对此下采样图像插值出上采样图像;步骤二、采用基于块的下采样方法,提高下采样图像的质量;步骤三、判断与内容是否无关;是,执行步骤四;否,执行步骤五;步骤四、与内容无关的下采样,插值系数组成插值矩阵,对插值过程求逆得到下采样图像;步骤五、与内容相关,给出初始系数,运用与内容无关的方法得到一幅初始的下采样图像,根据得到的图像训练出新的插值系数,然后再迭代得到下采样图像。用于图像及视频处理。

    一种基于大核注意力与混合可变形专家网络的视频去模糊方法

    公开(公告)号:CN118247172A

    公开(公告)日:2024-06-25

    申请号:CN202410253369.7

    申请日:2024-03-06

    Abstract: 本发明提出了一种基于大核注意力与混合可变形专家网络的视频去模糊方法,属于视频去模糊技术领域;所述方法通过设计大核注意力骨干网络以更高效方式执行特征编码和解码,并设计了混合可变形专家通过在特征解码阶段各个专家之间的光流更新获得更精确地光流引导执行帧间对齐以便于更好地利用清晰帧;本发明区别于以往的视频去模糊网络,采用大核卷积和全局注意力设计,一方面大核卷积可以有效拓展传统卷积的感受野,另一方面注意力使网络能够捕获长距依赖关系;区别于以往的去模糊帧间对齐方法,通过共享一个额外的光流更新网络在多个可变形专家模型之间更新光流,利用更精确的光流执行帧间对齐。

    一种全景视频显著性预测方法及其系统

    公开(公告)号:CN117998093A

    公开(公告)日:2024-05-07

    申请号:CN202410118522.5

    申请日:2024-01-29

    Abstract: 一种全景视频显著性预测方法及其系统,涉及全景视频显著性预测技术领域。解决现有全景视频显著性预测方法,普遍存在对视频特征提取能力不够,程序运行速度慢,预测显著性图准确度不高的问题。方法为:先提取出全景视频的视频帧并分别沿时间序列正向排列和反向排列;采用编码器分别处理正向排列和反向排列的视频帧序列,分别获得所有正向排列和反向排列帧的全局时空特征;采用解码器分别处理正向视频帧的全局时空特征和反向视频帧的全局时空特征,并将分别获得的显著性信息进行叠加,将叠加后的显著性图通过后处理模块和多种高斯先验特征结合,产生更符合人眼观察偏置的显著性图。本发明适用于全景视频中的显著性预测。

    混合视频编码标准中基于多尺度神经网络的帧内预测算法

    公开(公告)号:CN110324638A

    公开(公告)日:2019-10-11

    申请号:CN201910689148.3

    申请日:2019-07-29

    Abstract: 本发明提出了混合视频编码标准中基于多尺度神经网络的帧内预测算法,属于视频编码技术领域。所述帧内预测算法包括:步骤一:获取当前编码块的预测值;步骤二:将当前编码块与相邻的L-型重构像素拼接成更大的图像块;步骤三:将拼接后的图像块输入到多尺度特征提取网络获得多尺度特征;步骤四:将多尺度特征输入到复原网络中,通过使用卷积层实现图像预测模块的复原,获得当前编码块更准确的预测块。所述帧内预测算法能够有效提高混合视频编码标准中帧内预测的准确性。

Patent Agency Ranking