-
公开(公告)号:CN118230208A
公开(公告)日:2024-06-21
申请号:CN202410259098.6
申请日:2024-03-07
申请人: 杭州当虹科技股份有限公司
IPC分类号: G06V20/40 , G06V10/46 , G06V10/44 , G06V10/54 , G06V10/56 , G06V10/422 , G06V10/80 , G06T7/269
摘要: 本发明公开了一种综合利用时域和空域特征的静止目标轮廓提取方法,包括以下步骤:采用多通道运动估计模块对输入视频序列在时域上进行帧间运动估计,生成光流图像,并将所述光流图像传递给轮廓初步提取模块;采用整帧信息提取模块对输入帧的空域提取包括边缘和角点的图像特征,以及提取包括纹理、形状、物体色彩的复杂特征;采用轮廓初步提取模块整合多个光流图像信息和整帧的特征信息,对静止目标轮廓进行初步处理,得到初步的目标轮廓;采用特征融合细化模块通过特征匹配和特征对齐的方法,将时域和空域的特征信息进行融合,细化目标,得到精确的目标轮廓。
-
公开(公告)号:CN113747154B
公开(公告)日:2024-06-21
申请号:CN202110993670.8
申请日:2021-08-27
申请人: 杭州当虹科技股份有限公司
IPC分类号: H04N19/124 , H04N19/142 , H04N19/149 , H04N19/176 , H04N19/184 , H04N19/436 , H04N19/91
摘要: 本发明公开了一种码率控制方法及编码器,方法包括:S1,在预处理阶段,根据当前帧与前一帧的基于宏块的直方图差异的统计,对当前帧是否为场景切换帧进行判断,根据场景切换检测结果,在码率控制前调整帧处理顺序;S2,根据当前帧的当前帧或宏块的绝对误差和失真来估计当前帧的预测比特以及量化参数,当经过若干帧的编码之后,视频缓冲校验器状态在一个合理范围内;S3,一帧分成多个宏块,调整每个宏块的量化参数;S4,编码完整帧之后,根据该帧的实际编码量化参数以及实际编码比特更新帧级预测模型参数,根据预测比特以及实际比特对视频缓冲校验器状态进行相应的更新,使下一个未编码帧在帧级码控分配量化参数时得到最新的视频缓冲校验器状态。
-
公开(公告)号:CN117896537A
公开(公告)日:2024-04-16
申请号:CN202311750874.4
申请日:2023-12-19
申请人: 杭州当虹科技股份有限公司
IPC分类号: H04N19/70 , H04N19/174 , H04N19/503
摘要: 本发明公开了一种基于SVT‑AVS3的超高清视频编码加速算法,包括:S1,在EncDecKernel中,编码每行首个最大编码单元LCU前循环遍历参考列表里的所有参考帧,根据运动搜索范围的高度searchAreaHeight以及对应参考帧已编码行lines_completed,判断参考帧的已编码行lines_completed是否大于当前编码行yLcuIdx加上运动搜索范围高度之和,若大于等于表示该参考帧已编码足够数量LCU满足参考关系,当前行可以开启编码;若小于表示该参考帧还未编码足够数量的LCU,则进入等待直至参考帧的lines_completed满足该条件;S2,在EncDecKernel中编码完第一行的LCU之后,将该帧已编码LCU行lines_completed参数设为0,并将当前帧发送至PictureManagerKernel中存入至参考帧队列;S3,在EncDecKernel中每编码完一行的LCU之后,将当前帧的已编码LCU行lines_completed参数更新为当前行的yLcuIdx,来表示当前帧已编码LCU行的数量。
-
公开(公告)号:CN117880525A
公开(公告)日:2024-04-12
申请号:CN202311856622.X
申请日:2023-12-29
申请人: 杭州当虹科技股份有限公司
IPC分类号: H04N19/42 , H04N19/44 , G06T9/00 , H04N19/147 , H04N19/91 , H04N19/124 , G06N3/0464
摘要: 本发明公开了基于深度学习的跨平台的图像压缩方法及图像解压缩方法,其中图像压缩方法包括训练过程和推理过程,进一步地训练过程包括训练数据预处理和模型训练,推理过程包括推理数据预处理和图像压缩,S101,数据预处理过程将每张训练集图像分割成若干较小的训练集图像块;S102,图像压缩网络的训练过程以训练集图像块作为输入,经过神经网络处理后,输出相应的重建训练集图像块;S103,所述推理数据预处理将待压缩图像分割成若干个较小的图像块;每个图像块的大小与训练过程的图像块大小保持一致;S104,图像压缩时,以一张待压缩的图像的所有图像块作为图像编码器及超先验编解码器的输入,得到用于存储与传输的压缩图像码流。
-
公开(公告)号:CN117880524A
公开(公告)日:2024-04-12
申请号:CN202311856307.7
申请日:2023-12-29
申请人: 杭州当虹科技股份有限公司
IPC分类号: H04N19/42 , H04N19/44 , G06T9/00 , H04N19/147 , H04N19/91 , G06N3/0464 , G06N3/094
摘要: 本发明公开了一种目标距离自适应的图像压缩方法及图像解压方法,其中图像压缩方法包括训练过程和推理过程,训练过程进一步包括深度信息提取、数据预处理和模型训练,S101,所述深度信息提取以包含近距离目标的图像作为输入,利用深度估计网络,从图像中提取出各像素对应的深度值,输出的结果为一张单通道的,分辨率与输入图像相同的包含深度数值的深度图;S102,所述数据预处理将用于训练的图像随机分割成较小的图像块,同时也将深度信息提取过程获得的深度图分割成与图像相对应的小块;S103,所述模型训练进行图像压缩网络的训练,以切割好的图像块作为输入,经过神经网络处理后,输出相应的重建图像块;S104,推理过程进行图像压缩。
-
公开(公告)号:CN117649480A
公开(公告)日:2024-03-05
申请号:CN202311526840.7
申请日:2023-11-16
申请人: 杭州当虹科技股份有限公司
IPC分类号: G06T15/55 , G06T15/08 , G06T15/00 , G06T9/00 , G06T7/80 , G06V10/80 , G06N3/042 , G06N3/08 , G06N5/04 , G06N3/048
摘要: 本发明公开了一种基于深度学习的神经辐射场优化方法,包括S10训练流程和S20推理流程,其中,S10训练流程进一步包括:S101,设置数据预处理模块用于生成一个特征编码,并与捕获图像的内外参数融合后,作为辅助网络的输入数据;S102,设置模型训练模块,神经辐射场接收采集的一系列捕获数据,所述捕获数据包括拍摄到的图像以及每张图像对应的内外参,根据神经辐射场的采样器输出的采样点的密度分布确定远近平面,并利用远近平面和采样点作为目标数据,将目标数据交给加权损失计算模块,神经辐射场预测颜色值和体密度并交给体渲染模块;辅助网络根据输入数据预测出估计的远近平面和采样点作为预测数据,并将预测数据交到加权损失计算模块。
-
公开(公告)号:CN116777762A
公开(公告)日:2023-09-19
申请号:CN202310446817.0
申请日:2023-04-24
申请人: 杭州当虹科技股份有限公司
摘要: 本发明公开了一种多模块阶梯式融合学习的视频修复方法,分阶段训练过程用于利用划痕检测模块初筛出一部分划痕,通过函数优化模块进行优化得到最佳的参数θU;采用函数优化模块对划痕检测模块单独进行优化;采用函数优化模块对光流变换融合模块和掩模提取模块一起优化;融合优化过程得到优化最佳整体参数;推理过程为划痕检测模块、光流变换融合模块、掩模提取模块和多模块融合模块的参数使用融合优化过程中得到的最佳参数θall,将待处理的视频或图像序列转换成模型适用的数据形式{framet},处理后的输出帧yfusion转换为实际输出的视频序列。
-
公开(公告)号:CN114359039A
公开(公告)日:2022-04-15
申请号:CN202111386455.8
申请日:2021-11-22
申请人: 杭州当虹科技股份有限公司
IPC分类号: G06T3/40 , G06N3/04 , G06K9/62 , G06V10/774 , G06V10/82
摘要: 本发明涉及图像处理技术,公开了基于知识蒸馏的图像超分方法,其方法包括,准备训练超分模型需要的输入和标签,输入是低分辨率图像,标签是高分辨率图像;复杂模型的获取,基于噪声水平的图像超分方法获得复杂模型;简单模型的获取,构建一个多尺度的简单超分模型;模型的训练,对于步骤2和步骤3的超分模型进行拼接,并基于复杂模型进行训练简单模型。本发明模型的输入是低分辨率图像,通过已经训练好的复杂超分模型,利用知识蒸馏技术,让简单模型学习复杂模型学到的超分知识,可以得到较好的超分结果,又有较快的运行速度。
-
公开(公告)号:CN110784713B
公开(公告)日:2022-02-22
申请号:CN201911286945.3
申请日:2019-12-14
申请人: 杭州当虹科技股份有限公司
IPC分类号: H04N19/172 , H04N19/44
摘要: 本发明公开了一种可变有效图像尺寸的编码及解码方法。它具体包括如下步骤:(1)编码器中:分析文件每帧的复杂度,将文件按复杂度来切段,评估每段适合的有效图像尺寸,并写入配置文件中,Resize模块根据配置文件中的帧级高宽设置决定图像是否resize,编码内核负责编码,码流合成器将编码内核出来的视频流和图像有效区域的信息打包成最终视频流输出;(2)解码器中:视频流解析器分析当前帧是否带有有效图像尺寸信息,解码内核负责解码,Resize模块根据有效图像尺寸和视频编码图像尺寸来决定是否resize。本发明的有益效果是:不改变编码图像尺寸,既保证观看效果,且适用于任何编解码器内核,对于编码器和解码器内核也没有任何影响,保证了其稳定性。
-
公开(公告)号:CN110572661B
公开(公告)日:2021-10-26
申请号:CN201910936941.9
申请日:2019-09-29
申请人: 杭州当虹科技股份有限公司
IPC分类号: H04N19/177 , H04N19/146 , H04N19/124 , H04N19/184 , H04N19/436
摘要: 本发明公开了一种面向4K/8K超高清视频编码的低延时码率控制方法。它具体包括如下步骤:(1)将GOP的长度设为整数M,令常规缓冲区预测所用帧数为K;(2)计算GOP中第i帧编码时缓冲区预测所用帧数N(i);(3)利用Rq模型计算出第i、…、i+N(i)帧的预估比特数;(4)计算第i帧的目标缓冲区饱和度F(i),判断F(i)是否小于0.5,若是则令q(i)=q(i)*w,或者判断F(i)是否大于0.8,若是则令q(i)=q(i)/w,并重新执行步骤(3);否则选择当前q(i)作为当前帧的最优量化步长,并执行步骤(5);(5)获取最优量化步长对帧进行编码。本发明的有益效果是:将缓冲区预测所需帧数进行自适应调整,避免了GOP并行编码时缓冲区预测因为等待其他GOP的帧导致编码延时加大的问题。
-
-
-
-
-
-
-
-
-