基于感兴趣区域的VVC码率控制方法及装置

    公开(公告)号:CN118101938B

    公开(公告)日:2024-06-25

    申请号:CN202410497734.9

    申请日:2024-04-24

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于感兴趣区域的VVC码率控制方法及装置,涉及视频编码领域,方法包括:使用基于残差SSD网络训练的人脸检测模型检测图像中的人脸区域作为ROI;使用斯塔克尔伯格模型对ROI的失真进行建模,并采用二分法求解ROI的目标比特;计算编码图像的JND图作为空域视觉敏感度,对8x8互不重叠的子块进行运动估计,得到时域视觉敏感度;将有约束问题转化为无约束问题,并采用KKT条件进行最优化求解,得到最优拉格朗日乘子用于进行比特分配。本发明考虑视频会议、视频监控等应用对ROI的需求增长,人眼对ROI区域重点关注,提取空时域感知敏感度,对ROI和nROI的比特分配问题分别建模并进行最优化求解,合理进行比特分配。

    一种基于纹理复杂度的H.266/VVC屏幕内容编码快速划分方法

    公开(公告)号:CN114697681A

    公开(公告)日:2022-07-01

    申请号:CN202210390001.6

    申请日:2022-04-14

    Applicant: 华侨大学

    Abstract: 本发明提供一种基于纹理复杂度的H.266/VVC屏幕内容编码快速划分方法,包括如下步骤:对输入的屏幕内容视频帧进行LoG检测,对CU计算四叉树划分、水平二叉树划分以及垂直二叉树划分的子CU的纹理复杂度差异值;并比较四叉树划分、水平二叉树划分以及垂直二叉树划分的子CU的纹理复杂度差异值大小;如果四叉树划分的纹理复杂度差异值为最小,则跳过四叉树划分的率失真优化过程,如果水平二叉树划分的纹理复杂度差异值为最小,则跳过水平二叉树和水平三叉树划分的率失真优化过程,如果垂直二叉树划分的纹理复杂度差异值为最小,则跳过垂直二叉树和垂直三叉树划分的率失真优化过程;本发明方法在保证编码效率几乎不变的情况下有效降低了编码器计算复杂度。

    一种基于异种神经网络的多模态东北虎再辨识方法及装置

    公开(公告)号:CN114743128B

    公开(公告)日:2024-08-09

    申请号:CN202210225924.6

    申请日:2022-03-09

    Abstract: 本发明公开了一种基于异种神经网络的多模态东北虎再辨识方法及装置,涉及机器视觉技术领域,可应用于跟踪东北虎的活动轨迹调查,对保护濒危的东北虎具有重大意义。本发明的异种神经网络包括用双分支残差神经网络和Transformer网络,其中,双分支残差卷积神经网络用于先对红外图像和可见光图像学习局部特征;Transformer网络对由双分支残差卷积神经网络学得的红外图像和可见光图像的局部特征,利用自注意力机制学习东北虎的全局特征。双分支残差卷积神经网络的各分支结构相同但参数独立,用于处理红外和可见光东北虎图像光谱、分辨率、对比度等特性;而Transformer网络从全局视角学习信息东北虎特征,减少图像模态差异带来的噪声影响,实现高准确率的东北虎再辨识。

    一种基于结构相似度的非局部注意力学习方法

    公开(公告)号:CN114972812A

    公开(公告)日:2022-08-30

    申请号:CN202210624115.2

    申请日:2022-06-02

    Abstract: 本发明提供一种基于结构相似度的非局部注意力学习方法,可广泛应用于机器视觉领域,例如图像分割、图像分类、图像识别等。现有非局部注意力方法简单计算不同空域位置的两个信号内积作为二者的相似度度量,并不完全符合人类视觉感知特点。针对这一问题,本发明提出利用结构相似度衡量不同空域位置的信号之间的相似度,在非局部注意力学习方法中充分考虑人类视觉对信号感知三个重要因素,即亮度、对比度和结构。其次,本发明进一步提出多尺度结构相似度度量策略,在不同尺度上更为全面地进行信号相似度度量。因此,本发明能够取得比现有非局部注意力方法更好地注意力学习效果。

    一种基于局部视频活动度的屏幕视频质量识别方法

    公开(公告)号:CN113014916A

    公开(公告)日:2021-06-22

    申请号:CN202110219595.X

    申请日:2021-02-26

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于局部视频活动度的屏幕视频质量识别方法,方法包括:分别对参考和失真屏幕视频序列采用3D‑LOG滤波器提取屏幕特征;计算屏幕区域相似度,基于3D‑LOG池化策略得到屏幕质量分数;分别对参考和失真屏幕视频序列采用3D‑NSS方法提取自然特征;计算自然区域相似度,基于池化策略得到自然质量分数;计算局部视频活动度;基于局部视频活动度结合屏幕和自然质量分数获得最终失真屏幕视频质量评价值。本发明充分考虑到人类视觉系统对于屏幕视频的屏幕和自然内容区域感知度不同且人眼对于边缘特征高度敏感,具有较好的失真屏幕视频质量评价性能。

    一种基于结构相似度的非局部注意力学习方法

    公开(公告)号:CN114972812B

    公开(公告)日:2024-06-18

    申请号:CN202210624115.2

    申请日:2022-06-02

    Abstract: 本发明提供一种基于结构相似度的非局部注意力学习方法,可广泛应用于机器视觉领域,例如图像分割、图像分类、图像识别等。现有非局部注意力方法简单计算不同空域位置的两个信号内积作为二者的相似度度量,并不完全符合人类视觉感知特点。针对这一问题,本发明提出利用结构相似度衡量不同空域位置的信号之间的相似度,在非局部注意力学习方法中充分考虑人类视觉对信号感知三个重要因素,即亮度、对比度和结构。其次,本发明进一步提出多尺度结构相似度度量策略,在不同尺度上更为全面地进行信号相似度度量。因此,本发明能够取得比现有非局部注意力方法更好地注意力学习效果。

Patent Agency Ranking