-
公开(公告)号:CN113011281A
公开(公告)日:2021-06-22
申请号:CN202110220509.7
申请日:2021-02-26
Applicant: 华侨大学
Abstract: 本发明公开一种基于3D‑DOG特征的光场图像质量识别方法,包括:将输入参考和失真光场图像转化为参考和失真光场序列;分别对参考和失真光场序列采用3D‑DOG滤波器提取3D‑DOG特征;基于3D‑DOG特征计算参考和失真光场序列的相似度;使用3D‑DOG特征池化策略计算得到光场图像质量分数。本发明充分考虑到人眼视觉系统对二维边缘信息和三维几何结构的敏感度,采用3D‑DOG特征有效地描述光场图像的场景边缘信息和结构变化,具有较好的光场图像质量评价性能。
-
公开(公告)号:CN113010720A
公开(公告)日:2021-06-22
申请号:CN202110208356.4
申请日:2021-02-24
Applicant: 华侨大学 , 厦门亿联网络技术股份有限公司 , 厦门云知芯智能科技有限公司 , 厦门华联电子股份有限公司
IPC: G06F16/583 , G06F16/33 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种基于关键对象特征的深度监督跨模态检索方法,具体包括:首先构建特征学习模块抽取每个模态的深度特征,建立每个模态的注意力网络模型将各个模态抽取的特征分为关键特征和辅助特征,然后将每个模态抽取的关键特征和辅助特征进行融合作为最终的语义表征,最后建立三重损失函数:公共空间损失,标签空间损失和模态间不变性损失对模型进行训练学习。本发明提供的方法不仅能提高检索速度而且能够有效解决跨模态检索中精确度不高的问题。
-
公开(公告)号:CN112911290A
公开(公告)日:2021-06-04
申请号:CN202110127867.3
申请日:2021-01-29
Applicant: 华侨大学
IPC: H04N19/13 , H04N19/182 , H04N19/467 , H04N1/32 , G06N20/00
Abstract: 本发明公开了一种基于预测差值压缩编码的密文图像可逆数据隐藏方法,方法包括:图像拥有者通过像素预测得到预测差值,采用熵编码对预测差值进行无损压缩编码,对压缩数据流和原图像分别加密,然后将加密后的压缩数据流保存在密文图像的低位有效位,最后将得到的含嵌入空间的密文图像上传云服务器;在云服务器端,数据嵌入者从含嵌入空间的密文图像中提取并解密数据,确定数据嵌入空间,通过比特替换方式嵌入加密后的附加数据,得到载密密文图像;授权接收者首先对载密密文图像低位位平面的压缩数据流解密,根据嵌入数据加密密钥则可正确提取得到嵌入的附加数据,根据图像加密密钥则可无失真恢复原图像;本发明方法可实现密文图像大容量的可逆数据隐藏,实现正确提取嵌入数据且无失真恢复原图像,可保障图像内容安全。
-
公开(公告)号:CN112905822A
公开(公告)日:2021-06-04
申请号:CN202110144443.8
申请日:2021-02-02
Applicant: 华侨大学 , 厦门亿联网络技术股份有限公司 , 厦门云知芯智能科技有限公司 , 厦门华联电子股份有限公司
Abstract: 本发明涉及一种基于注意力机制的深度监督跨模态对抗学习方法,针对每个模态构建深度学习网络获取深度特征,引入生成对抗网络,利用模态间的交叉判别借助注意力机制不断提炼模态特征网络的生成特征,在公共子空间进行异质性数据的度量的同时,利用标签信息在标签空间对模态数据进行深度监督学习。如此构建的网络,使得训练得到的基于注意力机制的跨模态深度监督对抗模型具有良好的图文互相检索性能;在检索过程中利用训练得到的网络模型M对待查询图像(文本)和候选库中的文本(图像)进行特征提取以及余弦距离计算,从而获取待查询图像(文本)与候选库中的文本(图像)数据之间的相似度较高者,实现跨模态检索。
-
公开(公告)号:CN111985547A
公开(公告)日:2020-11-24
申请号:CN202010802066.8
申请日:2020-08-11
Applicant: 华侨大学
Abstract: 本发明涉及一种基于注意力引导生成学习的跨分辨率车辆再辨识方法,方法包括:构建基于生成学习的车辆图像超分辨率网络,注意力引导机制,端到端的车辆图像超分辨率模型和再辨识模型联合机制,联合损失函数,从而实现高效跨分辨率车辆再辨识。本发明特别考虑了车辆再辨识中跨分辨率车辆图像识别精度不高的问题,即在实际情况中捕捉到的查询图像往往是低分辨率图像,无法准确匹配到查询库中高分辨率候选图像,本发明能够有效提高跨分辨率车辆再辨识的精度。
-
公开(公告)号:CN111432221A
公开(公告)日:2020-07-17
申请号:CN202010242715.3
申请日:2020-03-31
Applicant: 华侨大学
IPC: H04N19/70 , H04N19/42 , H04N19/85 , H04N19/147
Abstract: 一种基于信息复用的HEVC多描述视频编码方法,首选将序列进行下采样分为多个子序列,并将序列进行分类,利用序列间的相关性,以复用编码单元的分层深度、预测单元的最佳模式和预测向量方式编码,以及采用CU-SKIP模式、CU-INTER模式、CU-INTRA模式进行编码,有效地提高HEVC编码的容错能力,且只需要对输入视频序列的一个子序列进行编码预测,大大降低编码的计算复杂度,无需传输间接编码子序列各编码单元的编码树结构、预测模式及预测向量,因此可以大幅度降低多描述编码的冗余,提高编码效率。
-
公开(公告)号:CN111212289A
公开(公告)日:2020-05-29
申请号:CN202010031829.3
申请日:2020-01-13
Applicant: 华侨大学
IPC: H04N19/593 , H04N19/96 , H04N19/20
Abstract: 本发明涉及基于DCT能量分布与梯度特征的屏幕内容视频快速编码方法,属于视频编码领域。本方法考虑到屏幕内容和自然内容视频不同特性,利用屏幕内容视频边缘锐利和具有大面积均匀平坦区域的特点,将编码树单元分成三类:自然内容CTU,简单屏幕内容CTU和复杂屏幕内容CTU。然后根据不同的CTU类型提出各自的模式选择方案,自适应地跳过不必要的预测模式的率失真代价计算。本发明能够减少编码器计算开销,在保持编码性能和视频质量基本不变的情况下,减少编码时间。
-
公开(公告)号:CN106954077B
公开(公告)日:2020-03-31
申请号:CN201710208697.5
申请日:2017-03-31
Applicant: 华侨大学
IPC: H04N19/96 , H04N19/124 , H04N19/182 , H04N19/132
Abstract: 本发明涉及一种基于结构特征的HEVC码率控制方法,1)提取视频的帧图像,计算帧图像的编码树单元的2×2区域降采集特征图;2)基于各编码树单元的降采集特征图,计算当前各编码树单元的结构强度;3)基于当前各编码树单元的结构强度,计算当前帧图像的结构强度;4)基于各编码树单元的结构强度与当前帧图像的结构强度,计算各编码树单元的码率分配比重;5)根据各编码树单元的码率分配比重计算各编码树单元的量化参数。本发明利用编码树单元降采样特征图的结构强度来表征编码树单元的结构强度,很好地反应该编码树单元的感知特性,准确引导目标码率分配,获得更符合人眼特性的编码视频。
-
公开(公告)号:CN110913233A
公开(公告)日:2020-03-24
申请号:CN201911191837.8
申请日:2019-11-28
Applicant: 华侨大学
IPC: H04N19/593 , H04N19/597 , H04N19/70 , H04N19/96 , H04N19/176 , G06K9/62 , G06N3/08 , G06N3/04
Abstract: 本发明涉及一种3D-HEVC深度图帧内快速编码的方法,采用多分支卷积神经网络结构,对应多种不同深度等级,可以有效区分不同深度等级CU的分类结果。本发明可以直接测试每一帧所有CTU中不同深度等级CU的分类结果,而不需要对每个CU进行测试,进而能够有效降低网络预测过程的计算时间。
-
公开(公告)号:CN106960176B
公开(公告)日:2020-03-10
申请号:CN201710096262.6
申请日:2017-02-22
Applicant: 华侨大学
Abstract: 本发明一种基于超限学习机和颜色特征融合的行人性别识别方法,包括:提取未标记性别属性的训练图像的超限学习机特征;提取未标记性别属性的输入训练图像HSV颜色特征,将超限学习机特征与颜色特征进行组合,获得融合特征,根据融合特征和训练图像标签利用线性支持向量机SVM训练行人性别分类器;利用训练所得模型提取测试图像特征,同时提取其HSV颜色特征,接着将两类特征进行融合,获得测试图像的融合特征,用训练过程所得线性支持向量机SVM行人性别分类器对融合特征进行分类。本发明对输入图像提取超限学习特征与颜色特征并进行有效融合,实现两种特征的互补,更有效地捕捉行人性别属性,从而提高行人性别识别率。
-
-
-
-
-
-
-
-
-