-
公开(公告)号:CN106954077A
公开(公告)日:2017-07-14
申请号:CN201710208697.5
申请日:2017-03-31
Applicant: 华侨大学
IPC: H04N19/96 , H04N19/124 , H04N19/182 , H04N19/132
Abstract: 本发明涉及一种基于结构特征的HEVC码率控制方法,1)提取视频的帧图像,计算帧图像的编码树单元的2×2区域降采集特征图;2)基于各编码树单元的降采集特征图,计算当前各编码树单元的结构强度;3)基于当前各编码树单元的结构强度,计算当前帧图像的结构强度;4)基于各编码树单元的结构强度与当前帧图像的结构强度,计算各编码树单元的码率分配比重;5)根据各编码树单元的码率分配比重计算各编码树单元的量化参数。本发明利用编码树单元降采样特征图的结构强度来表征编码树单元的结构强度,很好地反应该编码树单元的感知特性,准确引导目标码率分配,获得更符合人眼特性的编码视频。
-
公开(公告)号:CN105141953A
公开(公告)日:2015-12-09
申请号:CN201510464054.8
申请日:2015-07-31
Applicant: 华侨大学
IPC: H04N19/109 , H04N19/147
Abstract: 本发明一种适用于HEVC的快速帧间模式选择方法,在帧间编码时,对每个编码树单元,也就是最大编码单元,按模式对应的编码单元尺寸从大到小顺序逐级计算对应的模式的率失真代价,当后一模式的率失真代价大于前一模式的率失真代价时,则结束该编码单元的模式选择,取前一模式为该编码单元的最佳模式;本发明所提出的方法简单易行,能大大降低HEVC帧间编码的计算复杂度。
-
公开(公告)号:CN119741304B
公开(公告)日:2025-05-06
申请号:CN202510262624.9
申请日:2025-03-06
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
Abstract: 本发明公开了一种基于三维人脸几何结构的无参考质量评估方法及装置,涉及计算机视觉领域,方法包括:三维人脸网格模型重建;计算映射关键点和提取关键点之间的欧几里得距离,获得几何一致性分数;用三维人脸分割算法划分人脸区域,计算高斯曲率得到区域曲率分数;计算模型表面的平滑度,检测模型表面是否存在不自然的突起或瑕疵,获得平滑度分数;将几何一致性分数、区域曲率分数和平滑度分数按照加权比例进行融合,输出三维人脸网格模型的综合质量分数。本发明无需依赖数据库中的标准人脸模型,能够基于人脸几何特征和区域性分析对单个重建的三维人脸网格模型质量进行全面评估,适用于智能美容、精准医疗等个性化重建场景。
-
公开(公告)号:CN119863405A
公开(公告)日:2025-04-22
申请号:CN202510341442.0
申请日:2025-03-21
Applicant: 华侨大学
IPC: G06T5/77 , G06T5/60 , G06V10/42 , G06V10/44 , G06V10/80 , G06V10/82 , G06V20/40 , G06N3/0455 , G06N3/0464
Abstract: 本发明一种基于频域融合的大面积缺损视频修复方法及装置,涉及视频处理技术领域,针对现阶段缺损视频修复方法主要局限于小面积缺损场景,对大面积缺损的视频内容修复能力不足,难以生成合理的视觉修复结果的问题,提出了一种有效的解决方法,方法包括以下步骤:首先,获取缺损的视频帧序列,对视频帧序列进行下采样;接着,使用堆叠的频域融合残差块对下采样后的缺损视频帧进行全局信息建模,频域融合残差块由两个自适应频域交叉融合模块依次连接而成;然后,利用堆叠的时间Transformer模块优化多帧之间的时间一致性;最后,进行上采样以重建视频帧,得到最终修复的视频。本发明能够在大范围缺损区域中生成视觉上合理、内容流畅自然的视频修复效果。
-
公开(公告)号:CN119809940A
公开(公告)日:2025-04-11
申请号:CN202510287141.4
申请日:2025-03-12
Applicant: 华侨大学 , 信泰(福建)科技有限公司
IPC: G06T3/4076 , G06N3/0464 , G06N3/048 , G06T3/4046 , G06V10/44 , G06V10/80 , G06V10/82
Abstract: 一种基于状态模型的光场图像超分辨率重建方法和装置,包括:构建浅层特征提取模块,用于对输入的待重建的光场图像的子孔径图像形式提取浅层特征;利用状态空间模型构建深层特征提取单元;基于所述深层特征提取单元构建光场空角特征重建模块,用于对所述浅层特征重建光场空角特征;基于所述深层特征提取单元构建光场结构特征重建模块,用于对所述浅层特征重建光场结构特征;构建高分辨率图像重建模块,用于将所述浅层特征、所述光场空角特征和所述光场结构特征进行层次特征融合和上采样得到重建高分辨率光场图像。本发明通过利用状态空间模型的动态特性,显著提升光场图像超分辨率方法的全局空角信息表征能力和细节重建能力。
-
公开(公告)号:CN119205752B
公开(公告)日:2025-03-14
申请号:CN202411703532.1
申请日:2024-11-26
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
IPC: G06T7/00 , G06N3/045 , G06V10/26 , G06V10/52 , G06V10/54 , G06V10/80 , G06V10/82 , G06V20/40 , H04N17/00
Abstract: 本发明公开了一种基于注意力引导的屏幕内容视频质量评价方法及装置,涉及视频质量评价领域,包括:构建时空融合的屏幕内容视频质量评价模型并训练,得到经训练的屏幕内容视频质量评价模型,屏幕内容视频质量评价模型包括空域质量评价分支和时域质量评价分支;获取屏幕内容视频并提取得到若干个碎片化视频和若干个关键帧;将每个碎片化视频和关键帧输入经训练的屏幕内容视频质量评价模型,分别经过空域质量评价分支和时域质量评价分支,得到空域质量分数和时域质量分数,两者结合得到屏幕内容视频的质量分数。本发明解决现有视频质量评价方法的敏感性差,视觉质量评价准确度低等问题。
-
公开(公告)号:CN119323805B
公开(公告)日:2025-02-25
申请号:CN202411876774.0
申请日:2024-12-19
Applicant: 华侨大学
IPC: G06V40/10 , G06N3/0464 , G06N3/084 , G06V10/32 , G06V40/20
Abstract: 本发明公开了一种动静正则混合采样的行人再辨识方法及系统,涉及公共安全智能视频监控技术领域。实践中,采样常独立于行人再辨识模型训练,导致训练过程采样的信息丢失不受控制,制约识辨准确性。为此,本发明设计了正则动态线性采样和静态线性采样混和方法,实现行人再辨识模型训练过程中联合优化采样效果,其中,前者通过归一化的可学习参数,以数据驱动的动态方式学得动态的像素组合权重;后者利用双线性变换来确定静态的像素组合权重,实现与数据无关的采样策略。本发明进一步设计了动静正则项,约束动态的像素组合权重与静态的像素组合权重之间的差异,控制可学习参数的自由度,更好地组合动静采样,减少传统单一静态采样过程中信息损失。
-
公开(公告)号:CN119478751A
公开(公告)日:2025-02-18
申请号:CN202510062002.1
申请日:2025-01-15
IPC: G06V20/30 , G06V40/70 , G06V40/10 , G06V40/16 , G06V10/44 , G06V10/74 , G06V10/762 , G06V10/774 , G06V10/80 , G06F16/583 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于渐进式多源特征融合与对齐的人像聚档方法及装置,涉及公共视频智能分析领域,包括:构建人像聚档模型,在人像聚档模型中,对人脸图像、人脸模拟素描画像、人体图像、人体模拟素描画像的特征进行渐进融合,并通过伪标签聚类和相似度约束对齐人体特征与人脸特征,有效融合多源人像特征,生成渐进多源融合的行人特征;将待查询人员的人脸图像、人体图像及其相对应的人脸模拟素描画像、人体模拟素描画像输入到经训练的人像聚档模型,得到待查询人员的渐进多源融合的行人特征,并计算其与数据库中每个参考样本的渐进多源融合的行人特征的相似度,以进行人像聚档。
-
公开(公告)号:CN119205752A
公开(公告)日:2024-12-27
申请号:CN202411703532.1
申请日:2024-11-26
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
IPC: G06T7/00 , G06N3/045 , G06V10/26 , G06V10/52 , G06V10/54 , G06V10/80 , G06V10/82 , G06V20/40 , H04N17/00
Abstract: 本发明公开了一种基于注意力引导的屏幕内容视频质量评价方法及装置,涉及视频质量评价领域,包括:构建时空融合的屏幕内容视频质量评价模型并训练,得到经训练的屏幕内容视频质量评价模型,屏幕内容视频质量评价模型包括空域质量评价分支和时域质量评价分支;获取屏幕内容视频并提取得到若干个碎片化视频和若干个关键帧;将每个碎片化视频和关键帧输入经训练的屏幕内容视频质量评价模型,分别经过空域质量评价分支和时域质量评价分支,得到空域质量分数和时域质量分数,两者结合得到屏幕内容视频的质量分数。本发明解决现有视频质量评价方法的敏感性差,视觉质量评价准确度低等问题。
-
公开(公告)号:CN118799923B
公开(公告)日:2024-12-24
申请号:CN202411282680.0
申请日:2024-09-13
Applicant: 华侨大学
Abstract: 本发明公开了一种基于掩膜引导双流网络的行人重识别方法及装置,涉及图像识别领域,构建行人重识别模型、第一教师模型和第二教师模型,行人重识别模型包括轮廓单元和暴露单元,将轮廓空间注意力模块作为第一学生模型并与第一教师模型进行蒸馏学习,构造轮廓流中由掩码引导的注意力损失;将暴露空间注意力模块作为第二学生模型并与第二教师模型进行蒸馏学习,构造暴露流中由掩码引导的注意力损失;构造面部信息损失和REID损失;根据轮廓流中由掩码引导的注意力损失、暴露流中由掩码引导的注意力损失、面部信息损失和REID损失构造总损失函数并对行人重识别模型进行训练,得到经训练的行人重识别模型以进行行人重识别,解决背景和衣服因素的干扰问题。
-
-
-
-
-
-
-
-
-