一种基于结构特征的HEVC码率控制方法

    公开(公告)号:CN106954077A

    公开(公告)日:2017-07-14

    申请号:CN201710208697.5

    申请日:2017-03-31

    Applicant: 华侨大学

    Abstract: 本发明涉及一种基于结构特征的HEVC码率控制方法,1)提取视频的帧图像,计算帧图像的编码树单元的2×2区域降采集特征图;2)基于各编码树单元的降采集特征图,计算当前各编码树单元的结构强度;3)基于当前各编码树单元的结构强度,计算当前帧图像的结构强度;4)基于各编码树单元的结构强度与当前帧图像的结构强度,计算各编码树单元的码率分配比重;5)根据各编码树单元的码率分配比重计算各编码树单元的量化参数。本发明利用编码树单元降采样特征图的结构强度来表征编码树单元的结构强度,很好地反应该编码树单元的感知特性,准确引导目标码率分配,获得更符合人眼特性的编码视频。

    一种适用于HEVC的快速帧间模式选择方法

    公开(公告)号:CN105141953A

    公开(公告)日:2015-12-09

    申请号:CN201510464054.8

    申请日:2015-07-31

    Applicant: 华侨大学

    Abstract: 本发明一种适用于HEVC的快速帧间模式选择方法,在帧间编码时,对每个编码树单元,也就是最大编码单元,按模式对应的编码单元尺寸从大到小顺序逐级计算对应的模式的率失真代价,当后一模式的率失真代价大于前一模式的率失真代价时,则结束该编码单元的模式选择,取前一模式为该编码单元的最佳模式;本发明所提出的方法简单易行,能大大降低HEVC帧间编码的计算复杂度。

    基于三维人脸几何结构的无参考质量评估方法及装置

    公开(公告)号:CN119741304B

    公开(公告)日:2025-05-06

    申请号:CN202510262624.9

    申请日:2025-03-06

    Abstract: 本发明公开了一种基于三维人脸几何结构的无参考质量评估方法及装置,涉及计算机视觉领域,方法包括:三维人脸网格模型重建;计算映射关键点和提取关键点之间的欧几里得距离,获得几何一致性分数;用三维人脸分割算法划分人脸区域,计算高斯曲率得到区域曲率分数;计算模型表面的平滑度,检测模型表面是否存在不自然的突起或瑕疵,获得平滑度分数;将几何一致性分数、区域曲率分数和平滑度分数按照加权比例进行融合,输出三维人脸网格模型的综合质量分数。本发明无需依赖数据库中的标准人脸模型,能够基于人脸几何特征和区域性分析对单个重建的三维人脸网格模型质量进行全面评估,适用于智能美容、精准医疗等个性化重建场景。

    基于频域融合的大面积缺损视频修复方法及装置

    公开(公告)号:CN119863405A

    公开(公告)日:2025-04-22

    申请号:CN202510341442.0

    申请日:2025-03-21

    Applicant: 华侨大学

    Abstract: 本发明一种基于频域融合的大面积缺损视频修复方法及装置,涉及视频处理技术领域,针对现阶段缺损视频修复方法主要局限于小面积缺损场景,对大面积缺损的视频内容修复能力不足,难以生成合理的视觉修复结果的问题,提出了一种有效的解决方法,方法包括以下步骤:首先,获取缺损的视频帧序列,对视频帧序列进行下采样;接着,使用堆叠的频域融合残差块对下采样后的缺损视频帧进行全局信息建模,频域融合残差块由两个自适应频域交叉融合模块依次连接而成;然后,利用堆叠的时间Transformer模块优化多帧之间的时间一致性;最后,进行上采样以重建视频帧,得到最终修复的视频。本发明能够在大范围缺损区域中生成视觉上合理、内容流畅自然的视频修复效果。

    一种动静正则混合采样的行人再辨识方法及系统

    公开(公告)号:CN119323805B

    公开(公告)日:2025-02-25

    申请号:CN202411876774.0

    申请日:2024-12-19

    Applicant: 华侨大学

    Abstract: 本发明公开了一种动静正则混合采样的行人再辨识方法及系统,涉及公共安全智能视频监控技术领域。实践中,采样常独立于行人再辨识模型训练,导致训练过程采样的信息丢失不受控制,制约识辨准确性。为此,本发明设计了正则动态线性采样和静态线性采样混和方法,实现行人再辨识模型训练过程中联合优化采样效果,其中,前者通过归一化的可学习参数,以数据驱动的动态方式学得动态的像素组合权重;后者利用双线性变换来确定静态的像素组合权重,实现与数据无关的采样策略。本发明进一步设计了动静正则项,约束动态的像素组合权重与静态的像素组合权重之间的差异,控制可学习参数的自由度,更好地组合动静采样,减少传统单一静态采样过程中信息损失。

    基于掩膜引导双流网络的行人重识别方法及装置

    公开(公告)号:CN118799923B

    公开(公告)日:2024-12-24

    申请号:CN202411282680.0

    申请日:2024-09-13

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于掩膜引导双流网络的行人重识别方法及装置,涉及图像识别领域,构建行人重识别模型、第一教师模型和第二教师模型,行人重识别模型包括轮廓单元和暴露单元,将轮廓空间注意力模块作为第一学生模型并与第一教师模型进行蒸馏学习,构造轮廓流中由掩码引导的注意力损失;将暴露空间注意力模块作为第二学生模型并与第二教师模型进行蒸馏学习,构造暴露流中由掩码引导的注意力损失;构造面部信息损失和REID损失;根据轮廓流中由掩码引导的注意力损失、暴露流中由掩码引导的注意力损失、面部信息损失和REID损失构造总损失函数并对行人重识别模型进行训练,得到经训练的行人重识别模型以进行行人重识别,解决背景和衣服因素的干扰问题。

Patent Agency Ranking