-
公开(公告)号:CN117915080B
公开(公告)日:2024-10-01
申请号:CN202410131440.4
申请日:2024-01-31
Applicant: 重庆邮电大学
IPC: H04N19/103 , H04N19/186 , H04N19/176
Abstract: 本发明属于视频编码领域,具体涉及一种适用于VVC SCC的快速编码模式决策方法,包括:将视频帧亮度分量分割成不同大小的子块并分为四组;对四组CU分别设计四种基于卷积神经网络的模式分类器,并设计损失函数进行训练;通过训练后的模式分类器并行预测每个子块的编码模式概率;对每个子块的编码模式概率进行排序,从大到小选择前n个模式的概率并求和,当所选模式的概率和大于设定阈值时,停止选择,得到最优编码模式。本发明针对VVC复杂的划分结构进行了优化,通过使用卷积神经网络,实现了对编码单元(CU)的模式快速预测,能够有效地跳过不可能的模式,显著减少了不必要的模式检查,从而大幅提高了编码速度。
-
公开(公告)号:CN118400528B
公开(公告)日:2024-10-18
申请号:CN202410224459.3
申请日:2024-02-29
Applicant: 重庆邮电大学
IPC: H04N19/13 , H04N19/122 , H04N19/132 , H04N19/159 , H04N19/186 , G06T9/00 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及视频编码领域,具体涉及一种多尺度360度视频帧内快速划分方法,包括构建并训练CU在不同尺寸不同纬度类别下的划分模式预测模型;获取待处理图像帧的亮度分量图像,对该亮度分量图像进行分割处理得到8种目标CU;针对每一目标CU的尺寸大小和纬度类别选取对应的划分模式预测模型,计算得到每一目标CU选取每一种划分模式的概率值;基于概率值,通过多级阈值选择方法确定每一目标CU的最优划分模式;本发明减少了需要计算RD cost的模式数量,从而减小了编码过程中的计算复杂度,提高了编码效率。
-
公开(公告)号:CN118018740B
公开(公告)日:2024-10-11
申请号:CN202410208011.2
申请日:2024-02-26
Applicant: 重庆邮电大学
IPC: H04N19/147 , H04N19/51 , H04N19/176 , H04N19/96
Abstract: 本发明提供一种基于深度学习的360度视频帧间模式决策方法,包括:当CU的运动状态为静止状态的预测概率大于等于第一设定阈值时跳过MMVD模式、CIIP模式、Affine模式、GPM模式、AMVP模式和Intra模式的率失真检查;当CU的运动状态为静止状态的预测概率大于等于第二设定阈值小于第一设定阈值时跳过MMVD模式、CIIP模式、GPM模式、AMVP模式和Intra模式的率失真检查;反之在编码完Merge模式和Affine模式后进行提前终止预测终止剩余模式的率失真检查,反之进行最优模式预测;当最优模式列表中前几个模式的概率之和大于第四设定阈值时,则终止列表中后续模式的率失真检查。
-
公开(公告)号:CN117915102A
公开(公告)日:2024-04-19
申请号:CN202410142922.X
申请日:2024-02-01
Applicant: 重庆邮电大学
IPC: H04N19/186 , H04N19/103 , H04N19/96
Abstract: 本发明属于视频编码领域,具体涉及一种基于内容划分的VVC SCC快速模式决策方法,包括:将视频帧亮度分量分割成64x64的CU;设计模式决策模型并对其进行训练;通过内容预测子网络预测该CU的类别概率,根据概率值将他们分类;若CU的类别为混合内容,继续预测内容;对于分类为自然内容的CU,直接选择Intra模式;对于分类为动画内容A和屏幕内容TGM的CU,进一步将其特征图送入模式预测子网络预测每个模式的概率;根据动画内容A和屏幕内容TGM的CU的编码概率值进行最优模式决策。本发明针对VVC复杂的划分结构进行了优化,通过使用CNN模型和基于组合的分类子网络,以实现对CU的内容分类和模式预测。
-
公开(公告)号:CN117880532A
公开(公告)日:2024-04-12
申请号:CN202410057279.0
申请日:2024-01-15
Applicant: 重庆邮电大学
IPC: H04N19/96 , H04N19/593 , H04N19/147 , H04N19/176
Abstract: 本发明涉及一种基于VVC的屏幕内容快速模式决策方法,包括:根据图像内容利用基于组合的分类策略将编码单元划分为屏幕内容CU、自然内容CU以及混合内容CU;根据CU之间的空间相关性对自然内容CU进行模式决策;根据CU的纹理特征和空间相关性特征以及中间编码信息对屏幕内容CU进行模式决策;对于混合内容CU则保留VVC默认的模式决策;本发明对于自然内容CU结合空间相关性跳过非Intra模式的检查,对于屏幕内容CU利用决策树来进行模式检查排序以及模式检查提前终止预测,实现了模式检查候选列表的缩减,减少了视频编码的时间。
-
公开(公告)号:CN117880532B
公开(公告)日:2024-10-11
申请号:CN202410057279.0
申请日:2024-01-15
Applicant: 重庆邮电大学
IPC: H04N19/96 , H04N19/593 , H04N19/147 , H04N19/176
Abstract: 本发明涉及一种基于VVC的屏幕内容快速模式决策方法,包括:根据图像内容利用基于组合的分类策略将编码单元划分为屏幕内容CU、自然内容CU以及混合内容CU;根据CU之间的空间相关性对自然内容CU进行模式决策;根据CU的纹理特征和空间相关性特征以及中间编码信息对屏幕内容CU进行模式决策;对于混合内容CU则保留VVC默认的模式决策;本发明对于自然内容CU结合空间相关性跳过非Intra模式的检查,对于屏幕内容CU利用决策树来进行模式检查排序以及模式检查提前终止预测,实现了模式检查候选列表的缩减,减少了视频编码的时间。
-
公开(公告)号:CN117915102B
公开(公告)日:2024-10-08
申请号:CN202410142922.X
申请日:2024-02-01
Applicant: 重庆邮电大学
IPC: H04N19/186 , H04N19/103 , H04N19/96
Abstract: 本发明属于视频编码领域,具体涉及一种基于内容划分的VVC SCC快速模式决策方法,包括:将视频帧亮度分量分割成64x64的CU;设计模式决策模型并对其进行训练;通过内容预测子网络预测该CU的类别概率,根据概率值将他们分类;若CU的类别为混合内容,继续预测内容;对于分类为自然内容的CU,直接选择Intra模式;对于分类为动画内容A和屏幕内容TGM的CU,进一步将其特征图送入模式预测子网络预测每个模式的概率;根据动画内容A和屏幕内容TGM的CU的编码概率值进行最优模式决策。本发明针对VVC复杂的划分结构进行了优化,通过使用CNN模型和基于组合的分类子网络,以实现对CU的内容分类和模式预测。
-
公开(公告)号:CN118400528A
公开(公告)日:2024-07-26
申请号:CN202410224459.3
申请日:2024-02-29
Applicant: 重庆邮电大学
IPC: H04N19/13 , H04N19/122 , H04N19/132 , H04N19/159 , H04N19/186 , G06T9/00 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及视频编码领域,具体涉及一种多尺度360度视频帧内快速划分方法,包括构建并训练CU在不同尺寸不同纬度类别下的划分模式预测模型;获取待处理图像帧的亮度分量图像,对该亮度分量图像进行分割处理得到8种目标CU;针对每一目标CU的尺寸大小和纬度类别选取对应的划分模式预测模型,计算得到每一目标CU选取每一种划分模式的概率值;基于概率值,通过多级阈值选择方法确定每一目标CU的最优划分模式;本发明减少了需要计算RD cost的模式数量,从而减小了编码过程中的计算复杂度,提高了编码效率。
-
公开(公告)号:CN118018740A
公开(公告)日:2024-05-10
申请号:CN202410208011.2
申请日:2024-02-26
Applicant: 重庆邮电大学
IPC: H04N19/147 , H04N19/51 , H04N19/176 , H04N19/96
Abstract: 本发明提供一种基于深度学习的360度视频帧间模式决策方法,包括:当CU的运动状态为静止状态的预测概率大于等于第一设定阈值时跳过MMVD模式、CIIP模式、Affine模式、GPM模式、AMVP模式和Intra模式的率失真检查;当CU的运动状态为静止状态的预测概率大于等于第二设定阈值小于第一设定阈值时跳过MMVD模式、CIIP模式、GPM模式、AMVP模式和Intra模式的率失真检查;反之在编码完Merge模式和Affine模式后进行提前终止预测终止剩余模式的率失真检查,反之进行最优模式预测;当最优模式列表中前几个模式的概率之和大于第四设定阈值时,则终止列表中后续模式的率失真检查。
-
公开(公告)号:CN117915080A
公开(公告)日:2024-04-19
申请号:CN202410131440.4
申请日:2024-01-31
Applicant: 重庆邮电大学
IPC: H04N19/103 , H04N19/186 , H04N19/176
Abstract: 本发明属于视频编码领域,具体涉及一种适用于VVC SCC的快速编码模式决策方法,包括:将视频帧亮度分量分割成不同大小的子块并分为四组;对四组CU分别设计四种基于卷积神经网络的模式分类器,并设计损失函数进行训练;通过训练后的模式分类器并行预测每个子块的编码模式概率;对每个子块的编码模式概率进行排序,从大到小选择前n个模式的概率并求和,当所选模式的概率和大于设定阈值时,停止选择,得到最优编码模式。本发明针对VVC复杂的划分结构进行了优化,通过使用卷积神经网络,实现了对编码单元(CU)的模式快速预测,能够有效地跳过不可能的模式,显著减少了不必要的模式检查,从而大幅提高了编码速度。
-
-
-
-
-
-
-
-
-