-
公开(公告)号:CN119011835A
公开(公告)日:2024-11-22
申请号:CN202410948217.9
申请日:2024-07-16
Applicant: 杭州电子科技大学
IPC: H04N19/124 , H04N19/154 , H04N19/70 , G06T9/00 , G06N3/0475 , G06N3/094
Abstract: 本发明属于视频图像压缩领域,公开了一种适用于机器视觉任务的恰可识别失真预测模型及方法,包括JRD图像生成网络G、判别网络D和残差引导JRD回归网络R;所述JRD图像生成网络G以未压缩的原图像作为输入,以假JRD图像作为输出;之后,将生成图像与原始图像的残差作为对原图的补偿信息一起输入残差引导JRD回归网络R,最终输出预测的JRD分数,其中判别网络D以对抗的方式与生成网络G一起训练,以帮助G产生更接近真JRD图像的生成结果。在本发明提出的无参考模型中,原图像不需要进行若干次的压缩编解码,使预测效率大大提升。同时,在回归网络中,生成图像的残差作为补充信息被输入,使模型最终预测结果更加准确可靠。
-
公开(公告)号:CN112967229B
公开(公告)日:2024-04-26
申请号:CN202110149351.9
申请日:2021-02-03
Applicant: 杭州电子科技大学
IPC: G06T7/00 , G06V20/40 , H04N19/154
Abstract: 本发明公开了基于视频感知特征参量度量计算恰可察觉失真阈值的方法,包括如下步骤:S1,时域感知参量同质化,包括如下步骤:S11,相对运动同质化,得到相对运动的视觉感知显著度;S12,背景运动同质化,得到背景运动导致的视觉感知不确定度;S13,时域持续时间的同质化,得到持续时间的视觉感知显著度;S14,残差波动强度同质化,得到残差波动强度导致的视觉感知不确定度;S2,时域参量融合,通过融合刺激导致的显著度和不确定度,计算时域权重因子,并提出显著度调节因子;S3,空时域JND模型的构建,利用时域权重因子和显著度调节因子对空域JND进行调节获得空时域JND模型。
-
公开(公告)号:CN119011840A
公开(公告)日:2024-11-22
申请号:CN202410948218.3
申请日:2024-07-16
Applicant: 杭州电子科技大学
IPC: H04N19/146 , H04N19/13 , H04N19/91 , G06T9/00 , G06N3/0464 , G06N3/0475 , G06N3/048
Abstract: 本发明属于视频编码领域,公开了一种基于人体特征紧凑表示的视频压缩方法,包括步骤1:构建人体视频压缩框架;使用人体骨架特征来表征运动,首先将提取出的骨架特征通过人体特征压缩算法压缩冗余,与参考帧一同传输到解码端;之后恢复成原骨架,与重构的参考帧一起输入到生成网络中生成预测帧;最后输入到残差优化模块中进一步提升质量;步骤2:设计人体特征压缩算法;步骤3:特征残差编码优化;首先通过特征提取器提取预测帧和原始帧的深度特征,之后计算深度特征之间的残差,输入到上下文编码器当中,在熵模型的优化下进一步降低比特率。本发明极大提高了人体骨架信息的压缩率;能够以较低的比特流生成主观与客观质量良好的重构人体视频。
-
公开(公告)号:CN118279251A
公开(公告)日:2024-07-02
申请号:CN202410342801.X
申请日:2024-03-25
Applicant: 杭州电子科技大学
IPC: G06T7/00 , G06N3/0455
Abstract: 本发明公开了一种用户生成视频质量评估方法及装置,通过构建视频质量评价模型,避免忽视过滤机制导致的评价准确性下降;通过双阈值自适应调整权重阈值策略,避免评价模型对失真信息建模能力的不足;通过视觉聚焦策略,设计全新的空域窗口,对原空域窗口进行补充,使评价模型空时域失真信息充分交互,初始阶段能够充分感知空域信息,最后阶段能够充分学习时域失真信息;在窗口注意力模块的基础上,增加基于中心凹效应的可学习窗口相对位置偏移表来表示不同窗口在全局的相对位置,避免全局位置信息的缺失,此外,在局部自注意力中设置了与面积成正比的区域面积因子,用于平衡不同面积窗口的通道组注意力权重,避免评价模型在全局建模方面的不足。
-
公开(公告)号:CN112967229A
公开(公告)日:2021-06-15
申请号:CN202110149351.9
申请日:2021-02-03
Applicant: 杭州电子科技大学
IPC: G06T7/00 , G06K9/00 , H04N19/154
Abstract: 本发明公开了基于视频感知特征参量度量计算恰可察觉失真阈值的方法,包括如下步骤:S1,时域感知参量同质化,包括如下步骤:S11,相对运动同质化,得到相对运动的视觉感知显著度;S12,背景运动同质化,得到背景运动导致的视觉感知不确定度;S13,时域持续时间的同质化,得到持续时间的视觉感知显著度;S14,残差波动强度同质化,得到残差波动强度导致的视觉感知不确定度;S2,时域参量融合,通过融合刺激导致的显著度和不确定度,计算时域权重因子,并提出显著度调节因子;S3,空时域JND模型的构建,利用时域权重因子和显著度调节因子对空域JND进行调节获得空时域JND模型。
-
-
-
-