-
公开(公告)号:CN111741306A
公开(公告)日:2020-10-02
申请号:CN202010505633.3
申请日:2020-06-05
Applicant: 华侨大学
IPC: H04N19/172 , H04N19/91 , H04N19/13
Abstract: 本发明公开了一种提高熵编码效率的JPEG压缩图像重编码方法,属于图像信号处理领域,方法包括:提取JPEG图像各数据分量Huffman编码定义表并构建Huffman树;提取在熵编码数据流中各数据分量行程长度编码并统计个数;对各数据分量的所有行程长度编码值重新分配Huffman编码;修改熵编码段中相应的行程长度编码值对应的Huffman编码;重组JPEG图像数据流,完成JPEG图像重编码。本发明能够提升JPEG图像熵编码效率性能,在保持图像质量完全一致和JPEG图像格式兼容性的情况下,降低JPEG图像文件大小。
-
公开(公告)号:CN111160226A
公开(公告)日:2020-05-15
申请号:CN201911370041.9
申请日:2019-12-26
Applicant: 华侨大学
Abstract: 本发明涉及一种基于视角自适应特征学习的行人性别识别方法包括:视角自适应训练过程,性别识别过程。本发明利用输入行人的视角信息来指导卷积神经网络的特征学习过程,以减轻行人视角变化对神经网络进行性别识别的影响,使训练得到的网络模型具有更加准确的行人性别识别效果。本发明结合了行人的视角信息,解决了以往基于卷积神经网络用在行人性别识别问题上的不足,有效地提高了行人性别识别精度。本发明可以被广泛地应用在智能视频监控场景,例如大型商场,机场,火车站等。
-
公开(公告)号:CN110944199A
公开(公告)日:2020-03-31
申请号:CN201911191751.5
申请日:2019-11-28
Applicant: 华侨大学
IPC: H04N19/186 , G06K9/62 , H04N19/176
Abstract: 本发明涉及一种基于时空感知特征的屏幕内容视频码率控制方法,充分考虑人眼视觉对屏幕内容视频的感知特性,利用最新的屏幕图像质量评价方法GFM建立空域感知模型,通过所得到的感知特性进行感知编码。本发明还充分利用了屏幕内容视频的内容特性以及帧间相关性,对不同的时域相邻块进行分析判断,分为三种不同类型的块,并利用这种特性进行合理的码率分配。本发明结合时空感知特性对屏幕内容视频进行合理的码率控制,降低误码率,节省码率开销的同时,提高视频的质量,具有重要的意义和价值。
-
公开(公告)号:CN110399886A
公开(公告)日:2019-11-01
申请号:CN201910635863.9
申请日:2019-07-15
Applicant: 华侨大学
Abstract: 本发明涉及一种屏幕图像JND模型构建方法。首先利用文本分割技术得到屏幕图像的文本区域;其次提取文本区域的边缘像素,将屏幕图像分为文本边缘区域和非文本边缘区域;然后利用边缘宽度和边缘对比度计算出边缘结构失真敏感度和边缘对比度掩蔽,得到文本边缘区域视觉掩蔽模型;接着计算出非文本边缘区域的亮度自适应和对比度掩蔽效应,得到非文本边缘区域视觉掩蔽模型;最后结合文本边缘区域和非文本边缘区域的视觉掩蔽模型得到屏幕图像JND模型。本发明充分考虑屏幕图像特点以及人眼对屏幕图像不同区域具有不同的视觉感知特性等因素,对屏幕图像的视觉冗余信息有较为准确的估计,可广泛地应用到屏幕图像技术领域。
-
公开(公告)号:CN110309770A
公开(公告)日:2019-10-08
申请号:CN201910577021.2
申请日:2019-06-28
Applicant: 华侨大学
Abstract: 本发明涉及一种基于四元组损失度量学习的车辆再辨识方法,包括:构建参数共享的四分支卷积神经网络,设计四元组损失函数,对输入的四元组图像进行距离度量学习。本发明特别考虑了车辆再辨识中的特殊难点,即,车型和颜色都相同的车辆具有非常相似的车辆外观,能够有效地解决车辆再辨识中对于高相似度车辆识别精度不高的问题。
-
公开(公告)号:CN106780463B
公开(公告)日:2019-07-05
申请号:CN201611158405.3
申请日:2016-12-15
Applicant: 华侨大学
Abstract: 本发明一种全参考多曝光融合图像质量评估方法,充分考虑人眼视觉系统和多曝光图像的特性,利用人眼对融合后的图像对比度和饱和度比较敏感的现象,在进行多尺度分解的基础上,以对比度作为权重值对多个参考图像进行融合后作为新参考图像,再与需评估的多曝光融合图像进行对比度和饱和度的相似性比较,从而得到单层质量评估值,再将多层质量评估值加权融合得到最终分数;该方法计算简单,充分反映了人眼对于多曝光融合图像的主观感知度,能够较好地评估多曝光融合图像的质量。
-
公开(公告)号:CN109801273A
公开(公告)日:2019-05-24
申请号:CN201910016167.X
申请日:2019-01-08
Applicant: 华侨大学
Abstract: 本发明涉及一种基于极平面线性相似度的光场图像质量评价方法,属于图像处理领域,根据人类视觉系统理解光场图像时对场景结构变化的敏感性和光场图像中包含丰富的场景结构变化信息提出,方法包括:对参考光场图像和失真光场图像分别提取极平面图;接着分别提取参考极平面图和失真极平面图的线性特征图,进而计算得到极平面线性特征相似度图;基于极平面线性相似度图得到最终失真光场图像质量评价值。本发明充分利用极平面线性特征来描述光场图像中场景结构变化,从而评价失真光场图像的质量,反映人眼主观视觉系统对于光场图像的主观感知度,具有较好的光场图像质量评价性能。
-
-
公开(公告)号:CN104967855A
公开(公告)日:2015-10-07
申请号:CN201510356968.2
申请日:2015-06-25
Applicant: 华侨大学
IPC: H04N19/503
Abstract: 本发明一种适用于监控视频的编码方法,首先,利用背景建模技术建立背景帧;其次,把视频帧分割为前景区域和背景区域,并进行背景替换,把视频帧的背景区域替换成背景帧的对应区域,即空间位置相同的区域;最后把背景替换后的监控视频帧送入编码器进行编码。由于相邻两帧之间背景区域的各像素值相同,在帧间编码时,编码器无需对背景区域进行编码。因此,本发明可在保证前景目标客观质量的前提下,大大提高监控视频编码的压缩效率,降低编码的计算复杂度,可广泛地应用于视频监控系统。
-
公开(公告)号:CN119991973A
公开(公告)日:2025-05-13
申请号:CN202510480150.5
申请日:2025-04-17
Applicant: 华侨大学
IPC: G06T17/00
Abstract: 本发明公开了一种基于多尺度高斯球的动态场景重建方法及装置,涉及计算机视觉领域,包括:采用运动恢复结构算法对待重建的视频帧序列进行处理,生成稀疏点云,对稀疏点云进行初始化,生成3D高斯球集合;采用双域变形模型和自适应时间戳对3D高斯球集合进行处理,得到变形的3D高斯球集合;对变形的3D高斯球集合进行多尺度高斯处理,生成多尺度高斯球集合;对多尺度高斯球集合进行基于像素覆盖率的高斯筛选,得到优化后的多尺度高斯球集合;基于优化后的多尺度高斯球集合进行Alpha混合处理,重建得到抗锯齿动态渲染场景图像。本发明解决了目前动态场景重建的计算开销大且存在混叠效应等问题。
-
-
-
-
-
-
-
-
-