Transformer与CNN相结合的视频插帧方法

    公开(公告)号:CN118828058A

    公开(公告)日:2024-10-22

    申请号:CN202410708537.7

    申请日:2024-06-03

    Abstract: 本发明公开了Transformer与CNN相结合的视频插帧方法。本发明的网络结构包括特征提取网络、光流估计网络和融合与细化网络。特征提取网络不同阶段的输出作为不同尺度的特征,光流估计网络通过对前后两帧视频图像进行特征提取和运动估计,生成前后两帧到中间帧的双向光流信息,融合与细化网络输入为特征提取网络提取的不同阶段的特征信息、光流估计网络生成的输出光流,输出为一张掩膜图像以及一副残差图像。原始图像经过光流的绘制,再通过掩膜做加权最后加上残差图像,输出最终的插帧图像。本发明通过Transformer模型与CNN网络相结合,能够从整个图像范围内提取丰富的语义信息,并有效地捕捉帧间的运动关系。

    结合时空特征优化的多尺度视频插帧方法

    公开(公告)号:CN118646912A

    公开(公告)日:2024-09-13

    申请号:CN202410661885.3

    申请日:2024-05-27

    Abstract: 本发明属于视频处理技术领域,公开了一种结合时空特征优化的多尺度视频插帧方法,首先通过多尺度特征编码完成不同感受野的运动特征提取,接着利用注意力机制增强输入特征之间的时空依赖性,然后在解码阶段加入时间特征实现任意时刻的中间帧运动估计。采用迭代解码端的方式合成不同时刻的中间帧。最后,将生成的所有结果通过时空优化模块共同优化,进一步捕获多个中间帧之间时空上的关联,保证多倍视频插帧结果的整体一致和连贯性。本发明方法利用重建损失、中间特征损失和感知损失联合优化,有效地解决视频插帧中大尺度运动场景预测不准确的问题,得到更逼真的中间帧。

    一种基于多分支对称网络的非线性运动估计视频插帧方法

    公开(公告)号:CN117376584A

    公开(公告)日:2024-01-09

    申请号:CN202311500891.2

    申请日:2023-11-13

    Abstract: 本发明方法公开了一种基于多分支对称网络的非线性运动估计视频插帧方法,在粗帧合成阶段提取多个连续的视频帧的高级语义特征,并进行编码特征的融合,通过双分支上采样模块中的特征的交互操作和单光流的逐层细化操作自适应地获取视频帧之间的非线性运动特征,得到更为准确的运动估计和粗帧,然后在细帧合成阶段,通过细化网络生成残差来补偿粗帧,得到细化后的中间帧。本发明解决了高阶非线性运动场景的视频插帧问题,提取多个视频帧的高级语义信息,自适应地建立运动模型,有效解决现有技术中难以用固定的数学模型准确描述的问题;通过借助深度学习技术,采用光流法策略,能够更好地处理复杂的运动场景,使得合成的中间帧图像在视觉上更加真实。

    一种基于H.266/VVC的分步全零块判决快速算法

    公开(公告)号:CN113365062B

    公开(公告)日:2022-11-18

    申请号:CN202110577832.X

    申请日:2021-05-26

    Abstract: 本发明属于视频编码领域,公开了一种基于H.266/VVC的分步全零块判决快速算法,包括如下步骤:首先,通过公式推导,得到一个真全零块(G‑AZB)预判决公式,所谓G‑AZB,即经过硬决策量化(HDQ)后为全零的变换块(TU);然后,对于那些经过HDQ后的非全零块,即伪全零块(P‑AZB),利用基于统计和经验得出的自适应阈值公式实现预判决;最后,对于剩余的一些“狡猾”的P‑AZB,利用机器学习,找寻了8个影响TU变成全零或者非全零块的影响因子,通过离线训练,实现预判决。本发明在保证性能基本不变的前提下,减少了计算复杂度;本发明在新一代视频编码标准VVC上进行,创新度较高。

    基于K-means模型的双视点立体视频融合方法

    公开(公告)号:CN113179396B

    公开(公告)日:2022-11-11

    申请号:CN202110295931.9

    申请日:2021-03-19

    Abstract: 本发明方法公开了基于K‑means模型的双视点立体视频融合方法。本发明方法首先对左、右视点深度图进行预处理,得到左、右视点深度图像;然后分别对左、右视点深度图像运用K‑means方法进行分割,对分割后的前景和背景区域深度图像进行三维投射运算,得到左、右视点的前景和背景绘制图像;以前景绘制图像为蓝本,用背景绘制图像填充前景绘制图像的空缺区域,将填充后的左、右视点绘制图像进行图像融合,获得虚拟视点绘制图像;最后将虚拟视点绘制图像的空洞区域根据空洞周围的像素信息进行加权填充,获得最终输出图像。本发明方法采用像素级别的操作,对空洞区域进行精准处理,使绘制效果在视觉效果上更加优质,更加协和。

    一种基于显著性的立体三维视频错误隐藏方法

    公开(公告)号:CN111770346B

    公开(公告)日:2022-09-30

    申请号:CN202010523987.0

    申请日:2020-06-10

    Abstract: 本发明公开了一种基于显著性的立体三维视频错误隐藏方法。传统的错误隐藏技术在视频流在传输过程中发生整帧丢失时恢复效果差。本发明方法首先获取丢失帧的运动显著性图、深度显著性图,深度边缘显著性图,然后融合运动显著性图和深度显著性图并块化,再与深度边缘显著性图合并得到最终显著性图,并进行显著等级划分。对高显著等级的区域采用视点间搜索像素填补和候选运动矢量补偿恢复,对中显著等级的区域采用时域搜索像素填补和视点间搜索像素填补,对低显著等级区域采用时域帧像素拷贝填补。本发明方法除了结合3D—HEVC特性提出新的错误隐藏方法,考虑了视频画面的显著性,对立体视频在网络传输中发生的整帧丢失现象有很好的恢复效果。

    一种立体图像舒适度测试方法

    公开(公告)号:CN112738501B

    公开(公告)日:2022-05-17

    申请号:CN202011592782.4

    申请日:2020-12-29

    Abstract: 本发明公开了一种立体图像舒适度测试方法。传统的舒适度测试技术提取的特征较为简单,预测结果不够准确。本发明方法首先输入立体图像视差图提取基础视差特征,然后由视差图和中颞区皮层图提取视觉神经活动特征,再与颜色特征线性结合得到最终的舒适度预测特征,采用随机森林回归模型进行不舒适度测试,获得最终的立体视觉不舒适度分值。本发明的视觉神经活动特征模拟了大脑中颞区皮层视觉处理过程,视差特征和颜色特征则代表了图像内容本身。本发明方法充分考虑了影响立体图像舒适度的相关因素,在舒适度测试方面有很好的效果。

    一种发电机机组优化的方法

    公开(公告)号:CN110866632B

    公开(公告)日:2022-05-06

    申请号:CN201910988087.0

    申请日:2019-10-17

    Abstract: 本发明提供一种发电机机组优化的方法。本发明机组组合优化是一个双层优化问题,第一层优化是机组投入优化问题,采用改进的遗传算法来优化机组投入,在机组投入情况确定的基础上,进行第二层优化,第二层优化是机组出力优化,采用二次规划来解决,二次规划的结果作为适应度函数来进一步影响遗传算法中个体的进化。本方法可以为电力公司高效快速优化机组组合,减少能耗,方便机组检修,延长发电机寿命,为社会提供高质量电能。改进的遗传算法具有全局收敛性,平稳性,收敛更快,更加鲁棒的特点,与二次规划相结合更加适合优化机组组合优化。

    一种低复杂度的快速VVC帧内编码方法

    公开(公告)号:CN114222145A

    公开(公告)日:2022-03-22

    申请号:CN202111597858.7

    申请日:2021-12-24

    Abstract: 本发明公开了一种低复杂度的快速VVC帧内编码方法。本发明中基于上下文相关性的CU划分模块首先根据当前CU块的纹理特征将CU划分为复杂块和简单块;对简单块进行提前终止所有类型的划分,对复杂块继续进行二叉树划分和三叉树划分,以此解决多类型树划分带来的复杂度过高的问题。此外编码器决策出当前CU的最佳模式时。首先对帧内的粗选部分进行优化,在帧内角度预测模式的索引值为2~67的角度模式中每隔4个角度选取一个中心角度,然后基于此再小范围前后各增加2个角度模式搜索;然后利用最有可能模式(MPM)的概率分布特征,对帧内的细选部分进行优化。本发明在保证编码质量的同时降低了VVC编码的复杂度,特别是对于高分辨率的视频有非常好的编码性能。

Patent Agency Ranking