-
公开(公告)号:CN103747250B
公开(公告)日:2016-08-17
申请号:CN201310740320.6
申请日:2013-12-28
Applicant: 华中科技大学
IPC: H04N19/103 , H04N19/436 , H04N19/176
Abstract: 本发明公开了一种H.264/AVC中4x4子宏块的并行帧内预测方法,包括以下步骤:统一帧内预测公式、参考值数组、参考位置表和并行帧内预测的具体执行步骤,统一帧内预测公式是根据CUDA和帧内预测计算公式的特性改进而成的,通过将9种预测模式对应的预测公式变换成一个计算公式,满足了CUDA多线程单指令多数据流的需求,实现了帧内预测子宏块中细粒度并行,参考值数组及参考位置表是为了配合统一帧内预测公式而设计的,完全消除了影响并行算法性能的大量分支语句。本发明在帧内预测过程中实现了像素级并行,可以有效地利用GPU中众核资源加速帧内预测过程,缩短编码时间。
-
公开(公告)号:CN103747250A
公开(公告)日:2014-04-23
申请号:CN201310740320.6
申请日:2013-12-28
Applicant: 华中科技大学
IPC: H04N19/103 , H04N19/436 , H04N19/176
Abstract: 本发明公开了一种H.264/AVC中4x4子宏块的并行帧内预测方法,包括以下步骤:统一帧内预测公式、参考值数组、参考位置表和并行帧内预测的具体执行步骤,统一帧内预测公式是根据CUDA和帧内预测计算公式的特性改进而成的,通过将9种预测模式对应的预测公式变换成一个计算公式,满足了CUDA多线程单指令多数据流的需求,实现了帧内预测子宏块中细粒度并行,参考值数组及参考位置表是为了配合统一帧内预测公式而设计的,完全消除了影响并行算法性能的大量分支语句。本发明在帧内预测过程中实现了像素级并行,可以有效地利用GPU中众核资源加速帧内预测过程,缩短编码时间。
-