-
公开(公告)号:CN110399886B
公开(公告)日:2022-09-30
申请号:CN201910635863.9
申请日:2019-07-15
Applicant: 华侨大学
Abstract: 本发明涉及一种屏幕图像JND模型构建方法。首先利用文本分割技术得到屏幕图像的文本区域;其次提取文本区域的边缘像素,将屏幕图像分为文本边缘区域和非文本边缘区域;然后利用边缘宽度和边缘对比度计算出边缘结构失真敏感度和边缘对比度掩蔽,得到文本边缘区域视觉掩蔽模型;接着计算出非文本边缘区域的亮度自适应和对比度掩蔽效应,得到非文本边缘区域视觉掩蔽模型;最后结合文本边缘区域和非文本边缘区域的视觉掩蔽模型得到屏幕图像JND模型。本发明充分考虑屏幕图像特点以及人眼对屏幕图像不同区域具有不同的视觉感知特性等因素,对屏幕图像的视觉冗余信息有较为准确的估计,可广泛地应用到屏幕图像技术领域。
-
公开(公告)号:CN111126310B
公开(公告)日:2023-03-24
申请号:CN201911367254.6
申请日:2019-12-26
Applicant: 华侨大学
IPC: G06V40/10 , G06V10/774 , G06V10/82 , G06N3/0475 , G06N3/0464 , G06N3/094
Abstract: 本发明涉及一种基于场景迁移的行人性别识别方法,包括场景迁移过程与性别识别过程。本发明通过对偶生成对抗模型对来自不同场景的行人图像集进行图像迁移,减小不同数据集中行人场景的差异。利用迁移图像训练卷积神经网络,使网络模型具有较高精度的性别识别能力。本发明结合了对偶生成对抗模型用于图像迁移的优点,解决了以往基于卷积神经网络在行人性别识别问题上的不足,有效地提高了行人性别识别精度。本发明可以被广泛地应用在智能视频监控场景,大型商场的人口统计等。
-
公开(公告)号:CN111988613A
公开(公告)日:2020-11-24
申请号:CN202010778526.8
申请日:2020-08-05
Applicant: 华侨大学
IPC: H04N19/154 , H04N17/00 , G06K9/62
Abstract: 本发明涉及一种基于张量分解的屏幕内容视频质量分析方法,方法包括:对选定参考屏幕内容视频序列和失真屏幕内容序列分别进行张量分解,得到三方向切片集合的主成分切片;分别提取三方向参考主成分切片和三方向失真主成分切片的Gabor特征图,从而计算得到三方向特征相似度图;基于三方向特征相似度图获得最终失真屏幕内容视频质量分析值。本发明充分利用张量分解理论来描述屏幕内容视频的基本纹理结构,并通过Gabor滤波器提取人眼高度敏感的边缘信息,反映人眼视觉系统对于屏幕内容视频的主观感知度,具有较好的失真屏幕内容视频质量分析性能。
-
公开(公告)号:CN111126310A
公开(公告)日:2020-05-08
申请号:CN201911367254.6
申请日:2019-12-26
Applicant: 华侨大学
Abstract: 本发明涉及一种基于场景迁移的行人性别识别方法,包括场景迁移过程与性别识别过程。本发明通过对偶生成对抗模型对来自不同场景的行人图像集进行图像迁移,减小不同数据集中行人场景的差异。利用迁移图像训练卷积神经网络,使网络模型具有较高精度的性别识别能力。本发明结合了对偶生成对抗模型用于图像迁移的优点,解决了以往基于卷积神经网络在行人性别识别问题上的不足,有效地提高了行人性别识别精度。本发明可以被广泛地应用在智能视频监控场景,大型商场的人口统计等。
-
公开(公告)号:CN110399886A
公开(公告)日:2019-11-01
申请号:CN201910635863.9
申请日:2019-07-15
Applicant: 华侨大学
Abstract: 本发明涉及一种屏幕图像JND模型构建方法。首先利用文本分割技术得到屏幕图像的文本区域;其次提取文本区域的边缘像素,将屏幕图像分为文本边缘区域和非文本边缘区域;然后利用边缘宽度和边缘对比度计算出边缘结构失真敏感度和边缘对比度掩蔽,得到文本边缘区域视觉掩蔽模型;接着计算出非文本边缘区域的亮度自适应和对比度掩蔽效应,得到非文本边缘区域视觉掩蔽模型;最后结合文本边缘区域和非文本边缘区域的视觉掩蔽模型得到屏幕图像JND模型。本发明充分考虑屏幕图像特点以及人眼对屏幕图像不同区域具有不同的视觉感知特性等因素,对屏幕图像的视觉冗余信息有较为准确的估计,可广泛地应用到屏幕图像技术领域。
-
公开(公告)号:CN110516640B
公开(公告)日:2022-09-30
申请号:CN201910818186.4
申请日:2019-08-30
Applicant: 华侨大学
IPC: G06V20/58 , G06V10/46 , G06V10/774
Abstract: 本发明涉及一种基于特征金字塔联合表示的车辆再辨识方法,包括:构建特征金字塔,设计多级特征金字塔的联合表示方法,设计损失函数,对输入的图像进行距离度量学习和对比学习。本发明特别考虑了车辆再辨识中的难点,即由不同距离的摄像头捕捉到的车辆图像分辨率不同,能够有效地解决车辆再辨识中对于上述难点产生的车辆识别精度不高的问题。
-
公开(公告)号:CN110516640A
公开(公告)日:2019-11-29
申请号:CN201910818186.4
申请日:2019-08-30
Applicant: 华侨大学
Abstract: 本发明涉及一种基于特征金字塔联合表示的车辆再辨识方法,包括:构建特征金字塔,设计多级特征金字塔的联合表示方法,设计损失函数,对输入的图像进行距离度量学习和对比学习。本发明特别考虑了车辆再辨识中的难点,即由不同距离的摄像头捕捉到的车辆图像分辨率不同,能够有效地解决车辆再辨识中对于上述难点产生的车辆识别精度不高的问题。
-
公开(公告)号:CN111988613B
公开(公告)日:2022-11-01
申请号:CN202010778526.8
申请日:2020-08-05
Applicant: 华侨大学
IPC: H04N19/154 , H04N17/00 , G06K9/62
Abstract: 本发明涉及一种基于张量分解的屏幕内容视频质量分析方法,方法包括:对选定参考屏幕内容视频序列和失真屏幕内容序列分别进行张量分解,得到三方向切片集合的主成分切片;分别提取三方向参考主成分切片和三方向失真主成分切片的Gabor特征图,从而计算得到三方向特征相似度图;基于三方向特征相似度图获得最终失真屏幕内容视频质量分析值。本发明充分利用张量分解理论来描述屏幕内容视频的基本纹理结构,并通过Gabor滤波器提取人眼高度敏感的边缘信息,反映人眼视觉系统对于屏幕内容视频的主观感知度,具有较好的失真屏幕内容视频质量分析性能。
-
-
-
-
-
-
-