一种AME低复杂度仿射运动估计方法

    公开(公告)号:CN115442620B

    公开(公告)日:2025-04-22

    申请号:CN202211095417.1

    申请日:2022-09-06

    Abstract: 本发明属于视频编码领域,公开了一种AME低复杂度仿射运动估计方法,包括如下步骤:步骤1:基于划分深度的最优帧间模式的提前预测:根据父CU最优帧间模式来预测子CU最优帧间模式;步骤2:AME内部的低复杂度算法:在AME算法内部,通过CPMV平行与否、迭代过程的提前终止以及有无必要进行细粒度调整优化来加速AME算法;步骤3:AME外部的低复杂度算法:对于需要在传统Inter和AME之间进行模式决策的CU提取相关特征,基于决策树对这样的CU进行提前预测其最优帧间模式,以此跳过RDO决策及次优模式的遍历过程。本发明大大减少了VVC帧间模式决策复杂度。

    一种基于多层级架构的VVC全零块跳过方法

    公开(公告)号:CN119324988A

    公开(公告)日:2025-01-17

    申请号:CN202411874545.5

    申请日:2024-12-19

    Abstract: 本发明公开一种基于多层级架构的VVC全零块跳过方法,从变换块TU中读取变换系数后,通过其最大变换系数的幅值与预先计算的阈值进行比较,若小于阈值则判断为真全零块GAZB,则跳过量化和编码过程,反之则为非GAZB,接着利用率失真优化算法计算非GAZB跳过的代价,判断是否跳过非GAZB的编码过程,若其正常编码的代价大于非GAZB跳过的代价,则将该块判断为伪全零块PAZB进行跳过,反之,则被判断为非全零块NAZB;而在依赖性量化DQ的计算过程中,通过统计CG上下文特征来进行全零检测,以跳过检测为全零CG的编码过程。本发明没有使用机器学习技术,在确保编码质量的情况下减少了计算复杂度,加快编码速度。

    一种适用于机器视觉任务的恰可识别失真预测模型及方法

    公开(公告)号:CN119011835A

    公开(公告)日:2024-11-22

    申请号:CN202410948217.9

    申请日:2024-07-16

    Abstract: 本发明属于视频图像压缩领域,公开了一种适用于机器视觉任务的恰可识别失真预测模型及方法,包括JRD图像生成网络G、判别网络D和残差引导JRD回归网络R;所述JRD图像生成网络G以未压缩的原图像作为输入,以假JRD图像作为输出;之后,将生成图像与原始图像的残差作为对原图的补偿信息一起输入残差引导JRD回归网络R,最终输出预测的JRD分数,其中判别网络D以对抗的方式与生成网络G一起训练,以帮助G产生更接近真JRD图像的生成结果。在本发明提出的无参考模型中,原图像不需要进行若干次的压缩编解码,使预测效率大大提升。同时,在回归网络中,生成图像的残差作为补充信息被输入,使模型最终预测结果更加准确可靠。

    基于多阶层特征融合的虚拟视点绘制空洞填充方法

    公开(公告)号:CN118784845A

    公开(公告)日:2024-10-15

    申请号:CN202410741652.4

    申请日:2024-06-11

    Abstract: 本发明公开了基于多阶层特征融合的虚拟视点绘制空洞填充方法,将局部连续帧和非局部随机帧,通过多阶层编码进行特征细化,从空洞区域以外的已知区域传播时空信息,得到局部特征块和非局部特征块;对局部连续帧进行光流补全,得到带有空洞的相邻帧的光流特征,用于检测虚拟视点序列中的运动对象,以引导特征传播,特征传播结合所述局部特征块,传递和更新运动对象的信息,缓解了前背景混叠问题;将更新后的特征和非局部特征块进行内容重建,再解码重构得到空洞修复帧,加入多头时空自注意力模块和融合前馈神经网络,有利于聚合不同特征的信息,充分利用局部和非局部相邻帧的特征,较好处理伪影的问题。

    一种异构多尺度事件相机单目深度估计优化方法

    公开(公告)号:CN118537384A

    公开(公告)日:2024-08-23

    申请号:CN202410592852.8

    申请日:2024-05-14

    Abstract: 本发明属于深度估计技术领域,公开了一种异构多尺度事件相机单目深度估计优化方法,包括如下步骤:步骤1:异构多尺度事件相机单目深度估计优化模型;步骤2:异构数据匹配优化;步骤3:构建异构特征学习模型。本发明提出了异构多尺度事件相机单目深度估计优化模型,在研究事件相机单目深度估计模型优化的基础上,提出了异构数据匹配优化模型,解决了事件相机传感器与彩色相机传感器数据特征、结构迥异的问题;提出了异构数据学习模型,解决了异构数据特征不匹配的问题、学习约束过大导致部分通道产生负面效果的问题,为深度估计行业方案提供技术选择。

    一种扫描线级加速并行RDOQ方法
    88.
    发明公开

    公开(公告)号:CN117915095A

    公开(公告)日:2024-04-19

    申请号:CN202410020227.6

    申请日:2024-01-05

    Abstract: 本发明属于视频编码领域,涉及一种扫描线级加速并行RDOQ方法,采用SIMD指令,在预量化阶段同时对每个变换系数进行独立的预量化处理;在最优系数水平决策阶段,并行处理预量化后得到的量化系数,通过率失真优化来确定量化系数的最优值;在最后有效系数位置决策阶段,继续以并行处理的方式,同时基于贪婪策略获取到最优的最后有效系数位置。本发明的方法在保证编码性能损失较小的前提下,实现了RDOQ过程并行计算,且相比现有的并行RDOQ方法,本发明适用于硬件加速领域,基于贪婪算法实现LSC位置决策,创新度高,硬件吞吐量和编码性能有一个良好的折衷,为视频编码并行优化相关的算法研究提供了参考,具有重大意义。

    一种显著性检测中的深度图可信度检测方法

    公开(公告)号:CN112085683B

    公开(公告)日:2024-04-09

    申请号:CN202010816235.3

    申请日:2020-08-14

    Abstract: 本发明公开了一种显著性检测中的深度图可信度检测方法。该方法具体包括以下步骤:判断待测深度图像的收敛性;B)对收敛的深度图像做中值滤波处理;C)对中值滤波处理后的深度图像及其参考图像进行边缘检测,并获取边缘信息;D)计算深度图像及其参考图像的边缘的相似度,获得可信度分数。该方法引入图像收敛性概念,过滤显著物体不明显的深度图像,在提取边缘特征前进行中值滤波处理,通过自适应阈值的边缘检测,在像素级别上求取深度图像和参考图像的相似度,使深度图像显著物体的边缘定位更准确,不会受到边缘附近区块因失真等原因导致的数值变化的影响,获得的深度图像的可信度结果更为准确。

Patent Agency Ranking