-
公开(公告)号:CN113242428B
公开(公告)日:2024-03-15
申请号:CN202110406286.3
申请日:2021-04-15
Applicant: 中南大学
IPC: H04N19/139 , H04N19/154 , H04N19/167 , G06V40/16 , G06V10/25 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种视频会议场景下基于ROI区域的后处理加速方法,包括:若当前帧为第一帧,对视频的第一帧进行人脸识别处理得到人脸区域;将所述人脸区域进行扩展以得到ROI区域,对所述ROI区域进行图像质量增强;若当前帧不为第一帧,获取所述当前帧在前一帧的所述ROI区域内的运动矢量信息,根据所述运动矢量信息在所述当前帧对所述ROI区域进行位移,对位移后的所述ROI区域进行图像质量增强。针对视频会议场景的特点,借助人脸识别网络与视频编解码过程得到的运动矢量信息获取ROI区域,然后对此ROI区域进行后处理,输入质量增强网络就可以实现视频的部分增强,提升了后处理的运算效率,从而减少后处理的算法耗时。
-
公开(公告)号:CN112689145B
公开(公告)日:2024-02-13
申请号:CN202011418318.3
申请日:2020-12-07
Applicant: 中南大学
IPC: H04N19/11 , H04N19/136 , H04N19/14
Abstract: 本发明公开了一种VVC帧内编码的快速帧内模式选择方法,方法包括:获取图像,对图像进行预处理,得到图像的平滑信息和/或高频信息;根据图像的平滑信息和/或高频信息计算图像在VVC编码中的每个CU对应的平滑度和/或平均高频能量;根据图像在VVC编码中的每个CU对应的平滑度和/或平均高频能量对当前CU的帧内编码进行预测并使当前CU执行预测操作,其中预测操作包括:使当前CU跳过往下划分,执行当前层的帧内编码;或者使当前CU跳过当前层的帧内编码,执行往下划分;或者使当前CU执行当前层的帧内编码并执行往下划分。本方法能够在不损失较多质量的前提下,大幅度降低VVC编码复杂度,减少VVC编码时间。
-
公开(公告)号:CN113242426A
公开(公告)日:2021-08-10
申请号:CN202110369008.5
申请日:2021-04-06
Applicant: 中南大学
IPC: H04N19/137 , H04N19/146 , H04N19/186 , H04N19/80 , H04N19/96
Abstract: 本发明公开了一种视频编解码方法、设备和存储介质,包括:在编码端应用DBF滤波和/或SAO滤波,对于所述DBF滤波,根据编码单位的深度,对所述深度小于深度阈值的编码单位,跳过其DBF滤波;对于所述SAO滤波,根据编码单位的原始图像数据与做SAO之前的重构数据的差值,对差值小于差值阈值的编码单位,不进行SAO滤波;在解码端进行解码和后处理。该方法在保证解码视频质量损失较小的情况下,可大大缩减计算时间,有效降低编解码的计算复杂度。
-
公开(公告)号:CN113242426B
公开(公告)日:2024-02-13
申请号:CN202110369008.5
申请日:2021-04-06
Applicant: 中南大学
IPC: H04N19/137 , H04N19/146 , H04N19/186 , H04N19/80 , H04N19/96
Abstract: 本发明公开了一种视频编解码方法、设备和存储介质,包括:在编码端应用DBF滤波和/或SAO滤波,对于所述DBF滤波,根据编码单位的深度,对所述深度小于深度阈值的编码单位,跳过其DBF滤波;对于所述SAO滤波,根据编码单位的原始图像数据与做SAO之前的重构数据的差值,对差值小于差值阈值的编码单位,不进行SAO滤波;在解码端进行解码和后处理。该方法在保证解码视频质量损失较小的情况下,可大大缩减计算时间,有效降低编解码的计算复杂度。
-
公开(公告)号:CN112689145A
公开(公告)日:2021-04-20
申请号:CN202011418318.3
申请日:2020-12-07
Applicant: 中南大学
IPC: H04N19/11 , H04N19/136 , H04N19/14
Abstract: 本发明公开了一种VVC帧内编码的快速帧内模式选择方法,方法包括:获取图像,对图像进行预处理,得到图像的平滑信息和/或高频信息;根据图像的平滑信息和/或高频信息计算图像在VVC编码中的每个CU对应的平滑度和/或平均高频能量;根据图像在VVC编码中的每个CU对应的平滑度和/或平均高频能量对当前CU的帧内编码进行预测并使当前CU执行预测操作,其中预测操作包括:使当前CU跳过往下划分,执行当前层的帧内编码;或者使当前CU跳过当前层的帧内编码,执行往下划分;或者使当前CU执行当前层的帧内编码并执行往下划分。本方法能够在不损失较多质量的前提下,大幅度降低VVC编码复杂度,减少VVC编码时间。
-
公开(公告)号:CN113055676B
公开(公告)日:2024-04-26
申请号:CN202110331278.7
申请日:2021-03-26
Applicant: 中南大学
IPC: H04N19/172 , H04N19/513 , H04N19/70 , H04N19/42 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于深度网络视频编解码的后处理优化方法,包括:读取解码图像,在时空可变融合模块中对解码图像进行偏移量预测,偏移量预测包括对解码图像进行两次下采样和两次上采样,以得到第一偏移量;获取参考帧的运动矢量;根据运动矢量和第一偏移量计算得到第二偏移量;将第二偏移量用可变卷积计算得到特征图,使用图像质量提升模块处理特征图以得到残差图,将残差图加到解码图像以得到图像质量增强的解码图像。能够在具有较好的图像后处理增强质量的情况下,极大的简化了模型结构,缩短了神经网络卷积计算时间,降低了算法复杂度,提升了对码流中存在的解码信息的利用率,满足应用的实时需求。
-
公开(公告)号:CN113242428A
公开(公告)日:2021-08-10
申请号:CN202110406286.3
申请日:2021-04-15
Applicant: 中南大学
IPC: H04N19/139 , H04N19/154 , H04N19/167 , G06K9/00 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种视频会议场景下基于ROI区域的后处理加速方法,包括:若当前帧为第一帧,对视频的第一帧进行人脸识别处理得到人脸区域;将所述人脸区域进行扩展以得到ROI区域,对所述ROI区域进行图像质量增强;若当前帧不为第一帧,获取所述当前帧在前一帧的所述ROI区域内的运动矢量信息,根据所述运动矢量信息在所述当前帧对所述ROI区域进行位移,对位移后的所述ROI区域进行图像质量增强。针对视频会议场景的特点,借助人脸识别网络与视频编解码过程得到的运动矢量信息获取ROI区域,然后对此ROI区域进行后处理,输入质量增强网络就可以实现视频的部分增强,提升了后处理的运算效率,从而减少后处理的算法耗时。
-
公开(公告)号:CN113055676A
公开(公告)日:2021-06-29
申请号:CN202110331278.7
申请日:2021-03-26
Applicant: 中南大学
IPC: H04N19/172 , H04N19/513 , H04N19/70 , H04N19/42 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于深度网络视频编解码的后处理优化方法,包括:读取解码图像,在时空可变融合模块中对解码图像进行偏移量预测,偏移量预测包括对解码图像进行两次下采样和两次上采样,以得到第一偏移量;获取参考帧的运动矢量;根据运动矢量和第一偏移量计算得到第二偏移量;将第二偏移量用可变卷积计算得到特征图,使用图像质量提升模块处理特征图以得到残差图,将残差图加到解码图像以得到图像质量增强的解码图像。能够在具有较好的图像后处理增强质量的情况下,极大的简化了模型结构,缩短了神经网络卷积计算时间,降低了算法复杂度,提升了对码流中存在的解码信息的利用率,满足应用的实时需求。
-
-
-
-
-
-
-