-
公开(公告)号:CN118864287B
公开(公告)日:2024-11-29
申请号:CN202411319738.4
申请日:2024-09-23
Applicant: 华侨大学
Abstract: 本发明公开了一种渐进式单幅图像雨雪去除方法、装置及可读介质,涉及图像处理领域,包括:构建基于循环密集网络的图像雨雪去除模型并训练,得到经训练的图像雨雪去除模型,图像雨雪去除模型包括堆叠设置的若干个内外密集连接子网络,每个内外密集连接子网络包括堆叠设置的若干个内外密集连接块,每个内外密集连接块包括依次连接的长短期记忆模块、第一卷积层、通道注意力模块和第二卷积层;将退化图像输入经训练的图像雨雪去除模型,当前阶段的内外密集连接子网络输出的恢复估计与退化图像输入下一阶段的内外密集连接子网络中,最后一个阶段的内外密集连接子网络输出恢复图像。本发明解决目前渐进式雨雪去除方法所恢复图像中存在的伪影问题。
-
公开(公告)号:CN118450127B
公开(公告)日:2024-11-05
申请号:CN202410885047.4
申请日:2024-07-03
Applicant: 华侨大学
IPC: H04N19/147 , H04N19/625 , H04N19/136 , H04N19/149
Abstract: 本发明公开了一种融合空频域显著性特征的SCV编码感知码率控制方法及装置,涉及视频编码领域,方法包括:获取屏幕内容视频,通过卷积、相似度计算,对屏幕内容视频在空域上进行显著性建模,获得空域的显著性特征;其次利用DCT变换,对屏幕内容视频在频域上进行显著性建模,获得频域的显著性特征;然后利用显著性因子指导CTU级的目标比特分配;最后通过显著性因子构建显著性启发的感知码率控制模型,调节参数,实现码率控制。本发明通过提取空域和频域的显著性特征并加以融合求得显著性因子,使用显著性因子指导码率控制,能够提高编码率失真性能,提升码率分配精度。
-
公开(公告)号:CN118864287A
公开(公告)日:2024-10-29
申请号:CN202411319738.4
申请日:2024-09-23
Applicant: 华侨大学
Abstract: 本发明公开了一种渐进式单幅图像雨雪去除方法、装置及可读介质,涉及图像处理领域,包括:构建基于循环密集网络的图像雨雪去除模型并训练,得到经训练的图像雨雪去除模型,图像雨雪去除模型包括堆叠设置的若干个内外密集连接子网络,每个内外密集连接子网络包括堆叠设置的若干个内外密集连接块,每个内外密集连接块包括依次连接的长短期记忆模块、第一卷积层、通道注意力模块和第二卷积层;将退化图像输入经训练的图像雨雪去除模型,当前阶段的内外密集连接子网络输出的恢复估计与退化图像输入下一阶段的内外密集连接子网络中,最后一个阶段的内外密集连接子网络输出恢复图像。本发明解决目前渐进式雨雪去除方法所恢复图像中存在的伪影问题。
-
公开(公告)号:CN118521876B
公开(公告)日:2024-10-22
申请号:CN202410978491.0
申请日:2024-07-22
Applicant: 华侨大学 , 杭州电子科技大学 , 厦门亿联网络技术股份有限公司
IPC: G06V10/98 , G06N3/045 , G06N3/0464 , G06V10/40 , G06V10/54 , G06V10/74 , G06V10/776 , G06V10/82 , G06V20/40
Abstract: 本发明公开了一种基于相似性度量的沉浸式视频质量评价方法及装置,涉及视频处理领域,为了尽可能地解决视频中所存在的冗余信息问题,首先采用随机抽样的方式筛选视频帧;然后考虑到卷积神经网络能够很好地模拟人类视觉感知过程充分捕捉从低层次到高层次的视觉信息进而提取纹理和结构特征,采用预训练的ResNet50模型进行特征提取;并考虑到人类的视觉感知系统在观看视频时不仅会受视频内容的影响还会受到记忆时间的影响,利用一个受主观启发的时间池化策略得到纹理和深度视频的质量分数;最后根据人眼视觉的偏好对纹理和深度视频质量评分进行权重调整得到最终的沉浸式视频质量分数。本发明具有较好的沉浸式视频质量评价效果。
-
公开(公告)号:CN118411583B
公开(公告)日:2024-10-22
申请号:CN202410836696.5
申请日:2024-06-26
Applicant: 华侨大学
IPC: G06V10/776 , G06N3/0464 , G06V10/54 , G06V10/74 , G06V10/80 , G06V10/82 , G06V20/40
Abstract: 本发明公开了一种基于多特征融合的沉浸式视频质量评价方法及装置,涉及视频处理领域,包括:对参考纹理视频序列和失真纹理视频序列采用3D‑LOG滤波器进行特征提取,得到参考纹理特征和失真纹理特征,并计算得到纹理特征相似度,基于纹理特征相似度通过3D‑LOG池化策略得到纹理视频质量分数;根据参考深度视频序列和失真深度视频序列计算得到参考深度特征和失真深度特征;根据参考深度特征和失真深度特征计算得到深度特征相似度并确定梯度权重,根据深度特征相似度和梯度权重计算得到深度视频质量分数;根据纹理视频质量分数和深度视频质量分数计算得到待评价的沉浸式视频的质量分数,解决现有视频评价算法不符合人眼视觉特性和沉浸式视频的特点的问题。
-
公开(公告)号:CN118799923A
公开(公告)日:2024-10-18
申请号:CN202411282680.0
申请日:2024-09-13
Applicant: 华侨大学
Abstract: 本发明公开了一种基于掩膜引导双流网络的行人重识别方法及装置,涉及图像识别领域,构建行人重识别模型、第一教师模型和第二教师模型,行人重识别模型包括轮廓单元和暴露单元,将轮廓空间注意力模块作为第一学生模型并与第一教师模型进行蒸馏学习,构造轮廓流中由掩码引导的注意力损失;将暴露空间注意力模块作为第二学生模型并与第二教师模型进行蒸馏学习,构造暴露流中由掩码引导的注意力损失;构造面部信息损失和REID损失;根据轮廓流中由掩码引导的注意力损失、暴露流中由掩码引导的注意力损失、面部信息损失和REID损失构造总损失函数并对行人重识别模型进行训练,得到经训练的行人重识别模型以进行行人重识别,解决背景和衣服因素的干扰问题。
-
公开(公告)号:CN118609034B
公开(公告)日:2024-10-15
申请号:CN202411080625.3
申请日:2024-08-08
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
Abstract: 本发明公开了一种基于帧级时间聚合策略的沉浸式视频质量评价方法及装置,涉及视频处理领域,方法包括:通过帧抽样策略去除视频冗余信息,采用卷积网络对沉浸式视频(即多视点纹理加深度视频)不同区域进行多尺度特征提取;接着使用注意力模型对特征进行加权,通过帧级时间聚合策略自适应地筛选沿时间维度的质量分数;最终结合六自由度(Degree of Freedom,DoF)时空轨迹权重获取失真沉浸式视频质量分数。本发明具有较好的沉浸式视频质量评价效果,稳定性和鲁棒性高。
-
公开(公告)号:CN118334733B
公开(公告)日:2024-09-24
申请号:CN202410757576.6
申请日:2024-06-13
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
IPC: G06V40/16 , G06N3/0464 , G06N3/048 , G06N3/08 , G06V10/764 , G06V10/80 , G06V10/82
Abstract: 本发明公开了一种基于池化正交融合的面部色素斑分类方法及装置,涉及图像识别领域,包括:构建面部色素斑分类模型并训练,得到经训练的面部色素斑分类模型,面部色素斑分类模型中,利用深度骨干网络对色素斑图像进行特征提取,得到特征映射,池化正交融合模块中,先验平均池化分支用于提取特征映射中的空间全局信息,获得具有空间稳定性的先验池化特征,后验可学习池化分支借助可学习权重挖掘特征映射中的空间分布信息,获得空间敏感性的后验可学习池化特征,利用正交融合模块对先验池化特征和后验可学习池化特征进行正交融合,得到正交融合特征并输入到第一全连接层和Softmax函数层,输出预测类别概率。本发明解决散射分布斑点分类难的问题。
-
公开(公告)号:CN118368483B
公开(公告)日:2024-09-06
申请号:CN202410788949.6
申请日:2024-06-19
Applicant: 华侨大学
IPC: H04N21/44 , G06V20/40 , G06V10/764
Abstract: 本发明公开了一种电网环境下的视频帧间篡改检测方法、装置、设备及介质,方法包括以下步骤:获取包含多个视频的数据集;对每个视频,计算每帧画面的所有行像素的平均亮度值,获得每帧的行亮度序列,并连接所有帧的行亮度序列获得行亮度信号样本;对行亮度信号样本采用去除直流分量和下采样操作,获得预处理后的一维时间序列样本;利用一维时间序列样本训练时间序列异常检测模型;通过序列异常检测模型对待检测的视频进行检测,以输出所述视频的分类结果。本发明无须依赖参考电网频率数据库,也无需对视频中的电网频率信号进行估计,采用神经网络方法学习视频亮度序列的异常特征来检测视频帧间篡改,适用场景多,实用性强。
-
公开(公告)号:CN118334711B
公开(公告)日:2024-08-27
申请号:CN202410757573.2
申请日:2024-06-13
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
IPC: G06V40/10 , G06N3/0455 , G06N3/0464 , G06T7/70 , G06V10/26 , G06V10/764 , G06V10/82
Abstract: 本发明公开了一种基于服装描述生成的行人性别与年龄识别方法及装置,涉及图像识别领域,包括:构建行人性别与年龄识别模型,通过线性映射层和前a层Transformer块将行人图像处理为识别特征和图像特征,利用人体部位检测模型获取行人图像中的人体部位的位置,并裁剪出各个人体部位图像,利用图像字幕生成模型生成各个人体部位图像对应的服装文字描述,并利用词嵌入模型将服装文字描述映射为服装文字描述向量,将服装文字描述向量输入特征提取模块,提取得到对应的向量特征,将所有向量特征拼接后再连接至识别特征和图像特征后,并依次经过后b层Transformer块、第一全连接层和Softmax函数层,得到识别结果,解决性别与年龄识别技术受观察角度与环境等因素影响较大的问题。
-
-
-
-
-
-
-
-
-