-
公开(公告)号:CN111684799B
公开(公告)日:2023-07-25
申请号:CN201980009149.7
申请日:2019-06-25
Applicant: 北京大学 , 深圳市大疆创新科技有限公司
IPC: H04N19/139 , H04N19/159
Abstract: 提供一种视频处理方法和装置。该方法包括从当前块的运动矢量候选列表中选取目标候选块的运动矢量,运动矢量候选列表包括多个候选块的运动矢量;确定当前块的第一偏移值;当目标候选块和当前块位于不同帧,且目标候选块具有两个运动矢量时,确定当前块的第二偏移值;根据第一偏移值对目标候选块的第一运动矢量进行偏移;根据第二偏移值对目标候选块的第二运动矢量进行偏移。通过识别特定候选块,并为特定候选块选取适配的偏移方案,可以优化帧间预测方式。
-
公开(公告)号:CN116320484A
公开(公告)日:2023-06-23
申请号:CN202310505330.5
申请日:2019-03-13
Applicant: 北京大学 , 深圳市大疆创新科技有限公司
IPC: H04N19/577 , H04N19/105 , H04N19/107 , H04N19/124 , H04N19/13 , H04N19/137 , H04N19/176 , H04N19/51 , H04N19/517 , H04N19/61
Abstract: 本申请实施例提供一种视频处理方法和设备,提供了一种有效的在Merge模式下的视频处理方法。该方法包括:为当前帧的第一图像块,构建第一运动信息候选列表;从所述第一运动信息候选列表中,为所述第一图像块包括的至少一个子图像块分别选择运动信息,其中,所述第一运动信息候选列表包括至少一个双运动信息;基于至少一个所述子图像块的运动信息,对所述第一图像块进行编码或解码。
-
公开(公告)号:CN116137050A
公开(公告)日:2023-05-19
申请号:CN202310416460.1
申请日:2023-04-19
Applicant: 北京大学
Abstract: 本申请公开了一种三维真人模型处理方法、处理装置、电子设备及存储介质。该三维真人模型处理方法,包括:将输入的三维真人模型划分为粗粒度层和细粒度层;基于原始参数化真人模型SMPL、所述粗粒度层和所述细粒度层,获取与所述输入的三维真人模型相对应的编码数据;根据所述编码数据在解码端重建并输出三维真人模型。本申请实施例提供的三维真人模型处理方法,提高了三维真人模型传输后的视觉质量,能够在保证视觉感知效果的基础上极大节省三维真人模型传输过程中的码率。
-
公开(公告)号:CN116016925A
公开(公告)日:2023-04-25
申请号:CN202310035241.9
申请日:2023-01-10
Applicant: 北京大学
IPC: H04N19/146 , H04N19/124 , H04N19/13
Abstract: 本发明提供一种码率控制的方法及装置,所述方法包括:基于编码单元量化参数、目标图像中n种不同类别的样本的样本数量和n种不同类别的样本分别对应的预设量化参数偏差值确定所述目标图像中n种不同类别的样本中每种类别的样本的量化参数,n为大于1的整数;其中,所述每种类别的样本的量化参数与对应的样本数量的加权和恒等于所述编码单元量化参数和所述目标图像中n种不同类别的样本的总样本数量的乘积;基于所述每种类别的样本的量化参数确定编码单元的编码码率。基于此,能够保证根据图像中n种不同类别的样本的量化参数进行编码的编码码率和使用编码单元量化参数进行编码的编码码率相等。
-
公开(公告)号:CN111901590B
公开(公告)日:2023-04-18
申请号:CN202010604086.4
申请日:2020-06-29
Applicant: 北京大学
IPC: H04N19/103 , H04N19/176 , H04N19/513 , H04N19/56 , H04N19/96
Abstract: 本发明公开了一种用于帧间预测的细化运动矢量存储方法,方法包括:获取当前编码块的运动矢量预测值,并基于所述运动矢量预测值搜索当前编码块的实际运动矢量;依据所述实际运动矢量获取当前编码块的细化运动矢量;若当前编码块位于所属编码树单元的预设边界,则存储所述细化运动矢量;若当前编码块不位于所属编码树单元的预设边界,则存储所述实际运动矢量。由于只存储位于编码树单元的预设边界的编码块的细化运动矢量,可以保证提升运动矢量预测准确性的前提下,不降低各个编码块运动矢量存储的等待时间,以在保证编解码复杂度不发生变化的条件下有效提升编解码效率。
-
公开(公告)号:CN115834905A
公开(公告)日:2023-03-21
申请号:CN202310089995.2
申请日:2023-02-09
Applicant: 北京大学 , 咪咕文化科技有限公司
IPC: H04N19/503
Abstract: 本申请公开了一种帧间预测的方法、装置、电子设备及介质。本申请中,将参考帧输入到预设的第一时序学习模型中,推理一段时间内时空域的变化规律,并依据此导出初始预测信号;获取参考帧与待编码帧的高维特征,并将高维特征与初始预测信号融合到预设的第二时序学习模型中,得到扩展运动信息;基于扩展运动信息,对初始预测信号调整和增强。通过应用本申请的技术方案,可以实现一种利用第一时序学习模型提取用于表征若干个相邻的参考帧在时空域的变化规律的时域转换特征,导出内在运动信息,并利用第二序学习模型,学习扩展运动信息并以此得到预测帧。从而达到避免相关技术中出现的,采用固有的运动信息进行帧间预测会导致帧间预测的效果不佳的问题。
-
公开(公告)号:CN111901592B
公开(公告)日:2023-01-17
申请号:CN202010613236.8
申请日:2020-06-30
Applicant: 北京大学
IPC: H04N19/107 , H04N19/124 , H04N19/176 , H04N19/186 , G06N3/08
Abstract: 本申请公开了一种预测编码神经网络权重更新方法、装置及介质。本申请适用于基于神经网络的预测编码工具,包括帧内预测、帧间预测、以及预测后的增强等。由于视频前后帧存在的连续性,导致已编码帧与待处理帧在场景、纹理、内容的分布上存在着极高的相似性,因此在已编码数据中挖掘相关信息来调整网络参数可以使得神经网络定制化,十分有利于后续编码过程。另一方面,重构像素在编解码端都易获取,相比于预测像素,重构像素的客观质量更接近于原始像素,因此可以作为标签来反向微调神经网络的参数。
-
公开(公告)号:CN113194314B
公开(公告)日:2022-10-25
申请号:CN202110501154.9
申请日:2019-12-31
Applicant: 深圳市大疆创新科技有限公司 , 北京大学
IPC: H04N19/176 , H04N19/577 , H04N19/593 , H04N19/146 , H04N19/513 , H04N19/52
Abstract: 一种视频处理方法、编码端及解码端。其中,视频处理方法包括:获取当前块的时域运动矢量;根据所述当前块的时域运动矢量确定所述当前块在参考帧中的对应块;根据所述当前块在参考帧中的对应块确定所述当前块的子块的运动信息;将所述当前块的子块的运动信息加入所述当前块的仿射融合候选列表;根据所述仿射融合候选列表对所述当前块进行帧间预测。
-
公开(公告)号:CN114915783A
公开(公告)日:2022-08-16
申请号:CN202110169583.0
申请日:2021-02-07
IPC: H04N19/109 , H04N19/124 , H04N19/513 , H04N19/86 , H04N19/587
Abstract: 本申请提供了编码方法和装置。涉及基于人工智能(AI)的视频或图像压缩技术领域领域,具体涉及基于神经网络的视频压缩技术领域。该方法包括:获取当前图像的帧间预测图像,所述当前图像不是视频序列的首帧图像;将所述帧间预测图像输入预测细化网络得到增强的帧间预测图像;根据所述增强的帧间预测图像获取所述当前图像的重建图像。本申请能够提高编码效率。
-
公开(公告)号:CN114827609A
公开(公告)日:2022-07-29
申请号:CN202210308472.8
申请日:2019-07-09
Applicant: 北京大学 , 深圳市大疆创新科技有限公司
IPC: H04N19/13 , H04N19/186 , H04N19/70 , H04N19/91
Abstract: 提供了视频图像编码和解码方法、设备及介质,该视频图像编码方法包括对待编码图像的图像块的色度预测模式二值化得到包括至少两个相邻的比特位的比特串,其中待编码图像允许使用CCLM和/或常规帧内色度预测模式,CCLM至少包括第一、第二和第三模式,常规帧内色度预测模式为除CCLM以外的其他帧内色度预测模式;其中,相邻的比特位中的第一比特位用于指示是否采用CCLM,当第一比特位指示不采用CCLM时,第二比特位用于指示是否采用常规帧内色度预测模式中的第一模式,当第二比特位指示不采用常规帧内色度预测模式中的第一模式时,第三比特位用于指示是否采用常规帧内色度预测模式中的第二或第三模式;采用相互独立的概率模型分别对第一和第二比特位进行编码。
-
-
-
-
-
-
-
-
-