-
公开(公告)号:CN114286093B
公开(公告)日:2025-05-23
申请号:CN202111599851.9
申请日:2021-12-24
Applicant: 杭州电子科技大学
IPC: H04N19/119 , H04N19/105 , H04N19/14 , H04N19/11 , H04N19/593 , H04N19/147 , H04N19/96 , G06V10/764 , G06V10/82 , G06V10/774 , G06V20/40 , G06N3/0464 , G06N3/0455 , G06N3/0499 , G06N3/084
Abstract: 本发明公开了一种基于深度神经网络的快速视频编码方法。本发明包括基于深度神经网络的CU划分模块、基于邻域相关性的PU模式选择模块;CU块在帧内编码时会先经过PU模式选择计算率失真代价,此时先利用基于邻域相关性的PU模式选择模块进行优化,通过轻量级HCT模型的预测结果来减少RDO计算的候选模式数量;PU模式选择结束后,编码器会进行CU块深度判决,判断该CU块是否进行划分,此时由基于深度神经网络的CU划分模块进行优化,从HCT模型获得预测结果来判断是否提前终止划分。否则继续向下划分子CU块,并继续进行PU模式选择和CU块划分判决。本发明降低了CU递归划分的复杂度,简化了帧内预测模式的选择过程,有效地提高了HEVC编码的时间效率。
-
公开(公告)号:CN119996601A
公开(公告)日:2025-05-13
申请号:CN202510047128.1
申请日:2025-01-13
Applicant: 杭州电子科技大学
IPC: H04N7/01 , H04N21/2343 , H04N21/4402 , G06N3/045 , G06N3/0464 , G06N3/048
Abstract: 本发明属于图像/视频压缩技术领域,公开了一种基于多尺度网络的自适应分辨率分像素插值方法,包括如下步骤:步骤1:构建模型选择模块;所述模型选择模块根据视频分辨率来选择对应的神经网络模型,所述模型选择模块位于编解码器的帧间预测模块中,其输出的网络模型用于后续基于深度学习的分像素插值方法来生成分像素预测块;步骤2:构建基于空洞卷积的多尺度特征融合网络;步骤3:训练基于空洞卷积的多尺度特征融合网络;步骤4:构建基于深度学习的分像素预测模块。本发明根据视频分辨率来选择对应的神经网络模型,网络模型用于后续分像素插值任务得到分像素预测块,提升了分像素预测准确性。
-
公开(公告)号:CN115442620B
公开(公告)日:2025-04-22
申请号:CN202211095417.1
申请日:2022-09-06
Applicant: 杭州电子科技大学
IPC: H04N19/52 , H04N19/149 , H04N19/159 , H04N19/29 , H04N19/48
Abstract: 本发明属于视频编码领域,公开了一种AME低复杂度仿射运动估计方法,包括如下步骤:步骤1:基于划分深度的最优帧间模式的提前预测:根据父CU最优帧间模式来预测子CU最优帧间模式;步骤2:AME内部的低复杂度算法:在AME算法内部,通过CPMV平行与否、迭代过程的提前终止以及有无必要进行细粒度调整优化来加速AME算法;步骤3:AME外部的低复杂度算法:对于需要在传统Inter和AME之间进行模式决策的CU提取相关特征,基于决策树对这样的CU进行提前预测其最优帧间模式,以此跳过RDO决策及次优模式的遍历过程。本发明大大减少了VVC帧间模式决策复杂度。
-
公开(公告)号:CN119846548A
公开(公告)日:2025-04-18
申请号:CN202510339405.6
申请日:2025-03-21
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于非圆信号的对角化空间平滑相干DOA估计方法,该方法首先通过均匀线性阵列天线接收非圆信号得到接收信息,根据信号非圆特征,将接收信息与其共轭串联组合成扩展接收信息,并计算其协方差矩阵。然后从协方差矩阵中沿斜对角提取子阵,对提取的子阵分别进行增强空间平滑操作,将平滑操作的结果拼接生成新的协方差矩阵,对新的协方差矩阵执行特征值分解得到噪声子空间。最后基于噪声子空间,采用降维MUSIC算法估计非圆信号的DOA。本发明生成了包含更多信息的协方差矩阵,通过虚拟扩展提高了孔径,减轻了噪声干扰,能够有效恢复含有非圆相位的协方差矩阵的秩,提高DOA估计的鲁棒性和准确性。
-
公开(公告)号:CN119324988A
公开(公告)日:2025-01-17
申请号:CN202411874545.5
申请日:2024-12-19
Applicant: 杭州电子科技大学
IPC: H04N19/147 , H04N19/149 , H04N19/124 , H04N19/159 , H04N19/61 , H04N19/30
Abstract: 本发明公开一种基于多层级架构的VVC全零块跳过方法,从变换块TU中读取变换系数后,通过其最大变换系数的幅值与预先计算的阈值进行比较,若小于阈值则判断为真全零块GAZB,则跳过量化和编码过程,反之则为非GAZB,接着利用率失真优化算法计算非GAZB跳过的代价,判断是否跳过非GAZB的编码过程,若其正常编码的代价大于非GAZB跳过的代价,则将该块判断为伪全零块PAZB进行跳过,反之,则被判断为非全零块NAZB;而在依赖性量化DQ的计算过程中,通过统计CG上下文特征来进行全零检测,以跳过检测为全零CG的编码过程。本发明没有使用机器学习技术,在确保编码质量的情况下减少了计算复杂度,加快编码速度。
-
公开(公告)号:CN117915104A
公开(公告)日:2024-04-19
申请号:CN202410074860.3
申请日:2024-01-18
Applicant: 杭州电子科技大学
IPC: H04N19/30 , H04N19/103 , H04N19/149 , H04N19/176 , H04N19/503 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于神经网络的VVC多层次快速帧间编码系统及方法。本发明包括基于运动场与编码信息的CU划分终止模块;基于轻量级全连接网络的CTU深度预测模块;基于编码信息的TT划分终止模块;基于CNN的CU划分模式选择模块;通过四个模块之间多层次的组合,避免冗余的划分方式,降低帧间编码复杂度。本发明针对帧间编码的特性,利用编码上下文信息和神经网络的特征提取能力,从多个层次出发,各层次相互结合,兼顾复杂度与准确性,有效的降低了VVC帧间编码复杂度。
-
公开(公告)号:CN117915095A
公开(公告)日:2024-04-19
申请号:CN202410020227.6
申请日:2024-01-05
Applicant: 杭州电子科技大学
IPC: H04N19/147 , H04N19/436 , H04N19/124 , H04N19/146
Abstract: 本发明属于视频编码领域,涉及一种扫描线级加速并行RDOQ方法,采用SIMD指令,在预量化阶段同时对每个变换系数进行独立的预量化处理;在最优系数水平决策阶段,并行处理预量化后得到的量化系数,通过率失真优化来确定量化系数的最优值;在最后有效系数位置决策阶段,继续以并行处理的方式,同时基于贪婪策略获取到最优的最后有效系数位置。本发明的方法在保证编码性能损失较小的前提下,实现了RDOQ过程并行计算,且相比现有的并行RDOQ方法,本发明适用于硬件加速领域,基于贪婪算法实现LSC位置决策,创新度高,硬件吞吐量和编码性能有一个良好的折衷,为视频编码并行优化相关的算法研究提供了参考,具有重大意义。
-
公开(公告)号:CN112085683B
公开(公告)日:2024-04-09
申请号:CN202010816235.3
申请日:2020-08-14
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种显著性检测中的深度图可信度检测方法。该方法具体包括以下步骤:判断待测深度图像的收敛性;B)对收敛的深度图像做中值滤波处理;C)对中值滤波处理后的深度图像及其参考图像进行边缘检测,并获取边缘信息;D)计算深度图像及其参考图像的边缘的相似度,获得可信度分数。该方法引入图像收敛性概念,过滤显著物体不明显的深度图像,在提取边缘特征前进行中值滤波处理,通过自适应阈值的边缘检测,在像素级别上求取深度图像和参考图像的相似度,使深度图像显著物体的边缘定位更准确,不会受到边缘附近区块因失真等原因导致的数值变化的影响,获得的深度图像的可信度结果更为准确。
-
公开(公告)号:CN116528061A
公开(公告)日:2023-08-01
申请号:CN202310169232.9
申请日:2023-02-10
Applicant: 杭州电子科技大学
Abstract: 本发明属于图像处理技术领域,公开了一种脉冲视频信号可视化FPGA硬件及重建方法,包括Capture模块、SNN_IP算法模块和MIPI_OUT模块,所述Capture模块用于存储相机捕捉的脉冲信号并对其进行预处理;所述SNN_IP算法模块用于对预处理的脉冲数据采用TFP算法重构出灰度像素数据;所述MIPI_OUT模块用于将重构像素数据并行输出。本发明分别算法优化和系统级优化两部分来解决。一、算法优化方面:在重构算法上,我们运用TFP算法对视频脉冲流进行处理,实现了脉冲像素的快速重构。二、硬件级优化方面:采用pipeline结构,在限制资源的前提下,大大减少了运行时间。
-
公开(公告)号:CN114286093A
公开(公告)日:2022-04-05
申请号:CN202111599851.9
申请日:2021-12-24
Applicant: 杭州电子科技大学
IPC: H04N19/119 , H04N19/105 , H04N19/14 , H04N19/11 , H04N19/593 , H04N19/147 , H04N19/96 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于深度神经网络的快速视频编码方法。本发明包括基于深度神经网络的CU划分模块、基于邻域相关性的PU模式选择模块;CU块在帧内编码时会先经过PU模式选择计算率失真代价,此时先利用基于邻域相关性的PU模式选择模块进行优化,通过轻量级HCT模型的预测结果来减少RDO计算的候选模式数量;PU模式选择结束后,编码器会进行CU块深度判决,判断该CU块是否进行划分,此时由基于深度神经网络的CU划分模块进行优化,从HCT模型获得预测结果来判断是否提前终止划分。否则继续向下划分子CU块,并继续进行PU模式选择和CU块划分判决。本发明降低了CU递归划分的复杂度,简化了帧内预测模式的选择过程,有效地提高了HEVC编码的时间效率。
-
-
-
-
-
-
-
-
-