-
公开(公告)号:CN111985548A
公开(公告)日:2020-11-24
申请号:CN202010802092.0
申请日:2020-08-11
Applicant: 华侨大学
IPC: G06K9/62 , G06N3/04 , G06N3/08 , G06F40/30 , G06F16/906 , G06F16/901
Abstract: 本发明公开了一种标签引导的跨模态深度哈希方法,包括:构建图像、文本以及对应标签信息的特征提取网络,设计损失函数,对输入的文本和图像两个模态进行共同表征空间学习和标签空间的学习,进而消除不同模态间的语义鸿沟。本发明特别考虑了跨模态检索领域中的难点,不同模态的数据存在语义鸿沟,即表现为高层语义相关,底层特征异构,本发明能够有效提高跨模态检索精度。
-
公开(公告)号:CN109756719B
公开(公告)日:2020-06-26
申请号:CN201910080870.7
申请日:2019-01-28
Applicant: 华侨大学
IPC: H04N13/122 , H04N13/128 , H04N13/161 , H04N19/149 , H04N19/147 , H04N19/159 , H04N19/169 , H04N19/96
Abstract: 本发明涉及一种基于CU划分贝叶斯决策的3D‑HEVC帧间快速方法,属于视频编码领域;本方法首先对纹理图视频和深度图视频的编码单元(CU)划分的率失真代价(RDcost)和不划分的率失真代价(RDcost)进行高斯建模;然后通过离线训练计算先验概率;最后采用贝叶斯决策对当前编码单元(CU)划分与不划分计算后验概率,判断当前编码单元是否为最佳单元。本发明一种基于CU划分贝叶斯决策的3D‑HEVC帧间快速方法能够减少编码器计算开销,在保持编码性能基本不变的情况下,减少编码时间。
-
公开(公告)号:CN110390308A
公开(公告)日:2019-10-29
申请号:CN201910682423.9
申请日:2019-07-26
Applicant: 华侨大学
Abstract: 本发明涉及一种基于时空对抗生成网络的视频行为识别方法,包括:基于空域对抗生成网络提取输入的包含人类行为的视频的空间特征,基于时域对抗生成网络提取输入的包含人类行为的视频的时间特征,将空间对抗生成网络和时间对抗生成网络提取的两个维度特征进行拼接,得到时空融合特征,通过SVM支持向量机对融合后的特征向量进行分类,从而识别出视频行为。本发明基于时空生成对抗网络,充分考虑其学习特性、视频特点和人类动作特征,有效地结合人类行为特征提取视频中所包含的主要时空特征信息进行融合,基于时空特征信息之间的互补性获得更有表征能力的时空特征,从而对输入视频做出准确的行为识别。
-
公开(公告)号:CN107105297B
公开(公告)日:2019-08-30
申请号:CN201710357483.4
申请日:2017-05-19
Applicant: 华侨大学
IPC: H04N19/597 , H04N19/176 , H04N19/109 , H04N19/59
Abstract: 本发明公开了一种针对3D‑HEVC深度图帧内预测编码的快速优化方法,包括:对当前编码块CU计算其像素方差以及对角像素差的绝对值之和,根据当前编码块的方差以及对角像素差值的绝对值之和设定阈值,通过阈值比较,判定是否提前终止当前CU的深度划分;根据当前预测块PU外圈像素差的绝对值之和,设定阈值,通过阈值比较当前预测块PU是否属于平滑类型,从而跳过SDC编码,进一步降低计算复杂度。本发明能够在保持3D‑HEVC编码效率的前提下,有效地降低深度图帧内预测编码计算复杂度。
-
公开(公告)号:CN109982092A
公开(公告)日:2019-07-05
申请号:CN201910349667.5
申请日:2019-04-28
Applicant: 华侨大学
IPC: H04N19/503 , H04N19/119 , H04N19/14 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于多分支循环卷积神经网络的HEVC帧间快速方法,属于视频编码领域,方法包括:首先使用多分支卷积神经网络,对每个CTU进行预处理,并分别作为不同分支的卷积神经网络的输入,经过卷积计算之后,将得到的特征进行全连接,分为三个分支输出特征向量,再利用循环神经网络将特征向量和上一时刻的状态向量进行处理,并加入不同QP值的考量,最终输出三个分支的分类结果,三个分支分别对应每个CTU中深度等级0、1或2,判断三个深度等级的CU是否继续划分或者停止划分。本发明一种基于多分支循环卷积神经网络的HEVC帧间快速方法能够减少编码器计算开销,在保持编码性能基本不变的情况下,减少编码时间。
-
公开(公告)号:CN109756719A
公开(公告)日:2019-05-14
申请号:CN201910080870.7
申请日:2019-01-28
Applicant: 华侨大学
IPC: H04N13/122 , H04N13/128 , H04N13/161 , H04N19/149 , H04N19/147 , H04N19/159 , H04N19/169 , H04N19/96
Abstract: 本发明涉及一种基于CU划分贝叶斯决策的3D-HEVC帧间快速方法,属于视频编码领域;本方法首先对纹理图视频和深度图视频的编码单元(CU)划分的率失真代价(RDcost)和不划分的率失真代价(RDcost)进行高斯建模;然后通过离线训练计算先验概率;最后采用贝叶斯决策对当前编码单元(CU)划分与不划分计算后验概率,判断当前编码单元是否为最佳单元。本发明一种基于CU划分贝叶斯决策的3D-HEVC帧间快速方法能够减少编码器计算开销,在保持编码性能基本不变的情况下,减少编码时间。
-
公开(公告)号:CN106504230B
公开(公告)日:2019-02-26
申请号:CN201610886339.5
申请日:2016-10-11
Applicant: 华侨大学
IPC: G06T7/00
Abstract: 本发明涉及一种基于相位一致性的全参考彩色屏幕图像质量评估方法,属于图像处理领域,根据人类视觉系统理解图像时对结构信息的依赖性和屏幕图像包含丰富边缘结构信息的特征提出,方法包括:对参考屏幕图像和失真屏幕图像从RGB色彩空间转化为CIELAB对色空间;分别提取参考屏幕图像亮度分量和失真屏幕图像亮度分量的相位一致性特征图;结合相位一致性、黄蓝对比色度分量和红绿对比色度分量计算局部图像质量图;将局部图像质量图的标准差作为最终屏幕图像质量值。本发明充分利用相位一致性和色度分量的相似性来评估彩色失真屏幕图像的质量,反映人眼主观视觉系统对于屏幕图像的主观感知度,具有较好的屏幕图像质量评估性能,且计算简单。
-
公开(公告)号:CN109166160A
公开(公告)日:2019-01-08
申请号:CN201811082243.9
申请日:2018-09-17
Applicant: 华侨大学
IPC: G06T9/00
Abstract: 本发明公开了一种采用图形预测的三维点云压缩方法,属于视频编码领域,方法包括:采用KD树对输入三维点云进行自适应分块;采用KNN算法计算编码单元内每个点的K邻近点;构建每个单元块的图并计算图形平移算子;对每个编码单元的块进行去均值,采用K-means算法对编码单元进行自适应采样,通过求解优化问题对未采样点进行预测;利用基于KD树的块均值预测算法对每个编码单元块的均值进行预测编码;最后用算术编码器对所有量化的参数和残差进行熵编码。本发明采用图形预测,能够对庞大的三维点云数据进行有效压缩,极大地改善三维点云的传输和存储效率。
-
公开(公告)号:CN108737840A
公开(公告)日:2018-11-02
申请号:CN201810525043.X
申请日:2018-05-28
Applicant: 华侨大学
IPC: H04N19/593 , H04N13/161 , H04N13/128 , H04N13/106
Abstract: 本发明涉及一种基于深度图纹理特性的3D-HEVC帧内快速编码方法,方案简单可行,只需要在编码时利用灰度共生矩阵的特征值进行计算,并对相邻块模式进行获取,没有引入过多的额外计算复杂度。本发明充分利用了深度图纹理特征和预测模式之间的相关性:预测模式与深度纹理特征之间有着一定的相关性,某些预测模式只对具有特定纹理才具有较好的编码效果,本发明则充分利用了这一相关性。
-
公开(公告)号:CN105141953B
公开(公告)日:2018-05-25
申请号:CN201510464054.8
申请日:2015-07-31
Applicant: 华侨大学
IPC: H04N19/109 , H04N19/147
Abstract: 本发明一种适用于HEVC的快速帧间模式选择方法,在帧间编码时,对每个编码树单元,也就是最大编码单元,按模式对应的编码单元尺寸从大到小顺序逐级计算对应的模式的率失真代价,当后一模式的率失真代价大于前一模式的率失真代价时,则结束该编码单元的模式选择,取前一模式为该编码单元的最佳模式;本发明所提出的方法简单易行,能大大降低HEVC帧间编码的计算复杂度。
-
-
-
-
-
-
-
-
-