-
公开(公告)号:CN115297316B
公开(公告)日:2024-09-06
申请号:CN202210963297.6
申请日:2022-08-11
Applicant: 杭州电子科技大学
IPC: H04N13/271 , G06T5/50 , G06T7/13 , G06T5/20 , G06N3/0464 , G06N3/08 , G06T5/60
Abstract: 本发明方法公开了语境特征融合的虚拟视点合成图像空洞填充方法。本发明方法首先以参考视图、参考深度图和相机信息为单位,检测出深度图的前景信息并进行前景扩散,然后根据3D变换和参考信息绘制出虚拟视点图像,最后在生成对抗网络中加入具有语境特征融合的注意力生成空洞区域的像素。本发明根据3D‑warping、空洞和前景之间的位置关系和注意力机制原理,改进了已有的注意力提取特征的方法,尤其是在视频序列中包含快速运动的物体在修复工作中起重要作用。本发明加强了同一空洞区域的连续特征块之间的联系,消除前景信息对背景区域修复的影响,可以直接应用在3D视频处理,3D视频/图像物体修复等领域。
-
公开(公告)号:CN118279251A
公开(公告)日:2024-07-02
申请号:CN202410342801.X
申请日:2024-03-25
Applicant: 杭州电子科技大学
IPC: G06T7/00 , G06N3/0455
Abstract: 本发明公开了一种用户生成视频质量评估方法及装置,通过构建视频质量评价模型,避免忽视过滤机制导致的评价准确性下降;通过双阈值自适应调整权重阈值策略,避免评价模型对失真信息建模能力的不足;通过视觉聚焦策略,设计全新的空域窗口,对原空域窗口进行补充,使评价模型空时域失真信息充分交互,初始阶段能够充分感知空域信息,最后阶段能够充分学习时域失真信息;在窗口注意力模块的基础上,增加基于中心凹效应的可学习窗口相对位置偏移表来表示不同窗口在全局的相对位置,避免全局位置信息的缺失,此外,在局部自注意力中设置了与面积成正比的区域面积因子,用于平衡不同面积窗口的通道组注意力权重,避免评价模型在全局建模方面的不足。
-
公开(公告)号:CN113128344B
公开(公告)日:2024-02-02
申请号:CN202110297430.4
申请日:2021-03-19
Applicant: 杭州电子科技大学
Abstract: 本发明方法公开了一种多信息融合的立体视频显著性检测方法。本发明方法首先通过2D视频序列的色彩特征、空间特征、中心位置特征计算,得到2D空间显著图;基于时空一致性,在2D空间显著图的基础上获得2D运动显著图;然后利用不同区域的深度差异度计算深度空间显著图;提取深度变化的信息,获得深度运动图;最后使用多层细胞自动机融合产生的视频序列的四种显著图,得到立体视频的显著图。本发明方法根据人眼视觉注意力对色彩、空间位置、物体远近的敏感机制,尤其利用深度信息与运动信息在立体视觉显著性检测中的重要作用,融合了多种立体视频在空间和时间上的特征,消除单一特征计算显著性带来的噪声影响。
-
公开(公告)号:CN117376582A
公开(公告)日:2024-01-09
申请号:CN202311377320.4
申请日:2023-10-23
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种仿射运动估计的整数线性方程求解加速方法及装置,该方法首先在对数字视频图像帧进行仿射运动估计时,生成梯度搜索的初始运动向量。其次根据初始运动向量,计算当前图像编码单元与参考图像编码单元的图像梯度差异,构建待求解的差异运动向量方程组,并化简。然后对化简结果进行运算,得到差异运动向量方程组的解。最后根据解,计算得到当前图像编码单元的最优运动向量。该装置包括运动向量生成模块、方程组构建模块、方程组化简模块、方程组求解模块和运动向量输出模块。本发明消除了化简算法的除法延迟,大幅降低了资源消耗,能够实现高效率和高精度的整数化简运算。
-
公开(公告)号:CN117372461A
公开(公告)日:2024-01-09
申请号:CN202311312683.X
申请日:2023-10-11
Applicant: 杭州电子科技大学
IPC: G06T7/13 , G06T3/04 , G06T5/77 , G06T7/10 , G06N3/0464 , G06N3/0475 , G06N3/094 , G06N3/048 , G06N3/084
Abstract: 本发明公开了全局和局部多尺度动态虚拟视点空洞填充方法。本发明首先使用自适应动态模块生成最匹配的卷积核权重,提高了图像重建性能,加速了网络训练的收敛;然后引入了的全局和局部多尺度增强模块学习丰富的多尺度特征,将多尺度上下文信息注入到缺失区域并通过浅层特征与深层特征自适应加权融合,增强了局部特征到整体一致性的连接。在生成器中加入动态卷积模块,提高视觉任务中的性能,同时降低计算成本。本发明通过注意力机制允许网络更好地适应不同输入特征,尤其在处理复杂场景时表现出鲁棒性;使用多膨胀率的扩张卷积来捕获不同尺度特征,引入跨尺度特征融合以及局部和全局残差结构,提高对虚拟视点合成中的空洞区域进行精确填充的能力。
-
公开(公告)号:CN112351279B
公开(公告)日:2023-07-28
申请号:CN202011152367.7
申请日:2020-10-26
Applicant: 杭州电子科技大学
IPC: H04N19/14 , H04N19/61 , H04N19/177 , H04N19/103
Abstract: 本发明公开了一种面向HEVC快速编码的自适应复杂度调整系统及方法。本发明首先结合离线训练模块和在线训练模块,确定在给定编码树单元(CTU)的目标编码时间时启用的预测模式以及跳过的模式;然后使用复杂度分配模块,利用第3个图片组(GOP)的编码时间来预测整个序列的编码时间,从而估算出当前给定目标复杂度下所需控制的序列目标编码时间,并将目标编码时间以分层的方式分配到CTU层级;在模式选择模块中,根据分配到每个CTU的目标编码时间选择启用的预测模式,然后开始编码,跳过未启用的模式;最后复杂度更新模块周期性地取一帧作标准编码,用于更新序列的目标编码时间和调整下一帧的目标编码时间。本发明充分利用视频编码的特点将实际的编码复杂度自适应地调整在目标复杂度附近,并尽可能减少失真。
-
公开(公告)号:CN115426535A
公开(公告)日:2022-12-02
申请号:CN202211065539.6
申请日:2022-09-01
Applicant: 杭州电子科技大学
IPC: H04N21/81 , H04N13/117 , H04N13/128 , H04N13/15 , H04N13/161 , H04N13/366
Abstract: 本发明方法公开了基于背景分离的RGB‑D视频合成视点空洞掩盖方法。本发明方法以参考彩色图、参考深度图和相机信息为单位,利用加入并行注意力的P‑UNet网络分离彩色图前景、根据参考深度图前景与背景之间的像素突变分离前景,将两种方法的背景结合并使用高斯混合模型构建更干净的背景;使用基于深度和时间一致性的修复方法修复背景;然后根据3D变换公式和相机信息绘制出虚拟视点和虚拟背景,并再次修复虚拟背景;最后使用虚拟背景填充虚拟视点空洞中的缺失像素。本发明避免了修复时产生前景渗透,生成的空洞区域在相邻帧之间更有时间一致性,减少视频播放时的帧闪,提高了视觉质量。
-
公开(公告)号:CN115393392A
公开(公告)日:2022-11-25
申请号:CN202210923835.9
申请日:2022-08-02
Applicant: 杭州电子科技大学
Abstract: 本公开涉及一种视觉追踪系统、方法、介质及设备,所述视觉追踪系统,包括:跟踪器;还包括:决策器,用于在所述跟踪器每一轮跟踪结束后,决定是否需要更新外观模板,当需要更新外观模板时,更新所述跟踪器的外观模板;计算优化单元,用于对所述跟踪器和所述决策器的计算流图进行优化。本公开的方案提升了视觉目标跟踪在现实场景下的准确性,能应对物体形变、遮挡等复杂场景。本公开的方案使得视觉目标跟踪任务能在资源受限的硬件环境中运行,降低了部署视觉跟踪系统的成本。
-
公开(公告)号:CN112911286B
公开(公告)日:2022-11-15
申请号:CN202110133119.6
申请日:2021-01-29
Applicant: 杭州电子科技大学
IPC: H04N19/117 , H04N19/124 , H04N19/146 , H04N19/154 , H04N19/172 , H04N19/42 , H04N19/625 , G06N3/04 , G06N3/08
Abstract: 本发明属于图像/视频压缩领域,涉及一种基于新型损失函数和可变形卷积的分像素插值滤波器的设计方法,包括:步骤1,在准备训练数据时,采用运动模糊的方式,对高分辨率图像进行降采样操作;步骤2,数据训练过程中,输入降采样后的图像,使用残差学习技术,经过神经网络得到新型损失函数;步骤3,使用新型损失函数训练带有可变形卷积层的神经网络,生成所需残差图像。本发明的新型损失函数既能反映失真同时也考虑了码率;可变形卷积可以更灵活地适应不同的视频图像,从而达到提升编码效果的目的。
-
公开(公告)号:CN110365978B
公开(公告)日:2021-11-23
申请号:CN201910638183.2
申请日:2019-07-15
Applicant: 杭州电子科技大学
IPC: H04N19/124 , H04N19/176 , H04N19/625 , H04N19/70
Abstract: 本发明公开了一种基于机器学习算法多层次全零块预判决方法及系统。包括:S1:确定阈值Г1,当max(|dij|)<Γ1时,判定TU块经过HDQ量化后,会量化为全零TU,所述dij是经过DCT变换后的系数;S2:确定阈值Г2,当TU中满足公式(4)的DCT变换系数的个数小于等于Γ2时,则判定该TU经过HDQ方法后是non‑AZB,但是经过RDOQ方法后为AZB,所述公式(4)为所述Г2为S3:TU块经过RDOQ方法后采用机器学习的方法实现AZB预判决,机器学习方法分别提取了TU级别、系数级别和上下文语法元素级别的特征值。能够在量化之前实现较为准确的AZB预判决,实现减少视频编码负担和节约编码时间的目的。
-
-
-
-
-
-
-
-
-