-
公开(公告)号:CN109996084A
公开(公告)日:2019-07-09
申请号:CN201910361446.X
申请日:2019-04-30
Applicant: 华侨大学
IPC: H04N19/59 , H04N19/119 , H04N19/14 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于多分支卷积神经网络的HEVC帧内预测方法,属于视频编码领域,本方法使用多分支卷积神经网络,对每个CTU进行预处理,并分别作为不同分支的卷积神经网络的输入,经过卷积计算之后,将得到的特征进行全连接,考虑不同QP值的影响,并最终输出三个分支的分类结果,三个分支分别对应每个CTU中深度等级0,1,2,判断三个深度等级的CU是否继续划分或者停止划分。本发明一种基于多分支卷积神经网络的HEVC帧内预测方法能够有效地减少编码器计算开销,在保持编码性能基本不变的情况下,减少编码时间。
-
公开(公告)号:CN106303521B
公开(公告)日:2019-01-01
申请号:CN201610668684.1
申请日:2016-08-15
Applicant: 华侨大学
IPC: H04N19/105 , H04N19/114 , H04N19/115 , H04N19/147 , H04N19/176
Abstract: 本发明公开了一种基于感知敏感度的HEVC率失真优化方法,属于视频编码领域,方法包括:获取输入视频各编码块的梯度幅值方差,根据各编码块的梯度幅值方差计算当前帧的梯度幅值方差;有效利用各编码块和当前帧的梯度幅值方差关系计算各编码块的感知敏感度;并根据各编码块感知敏感度获取感知自适应的拉格朗日乘子;由所述拉格朗日乘子计算视频编码中的各编码块的率失真代价,从而确定其最佳编码模式。本发明能够提升编码器整体感知性能,在消耗相同码率的情况下,获得更高感知质量的编码视频。
-
公开(公告)号:CN108875906A
公开(公告)日:2018-11-23
申请号:CN201810359791.5
申请日:2018-04-20
Applicant: 华侨大学
CPC classification number: G06N3/0454 , G06N3/08
Abstract: 本发明涉及一种多尺度逐步累加的卷积神经网络学习方法,可广泛应用于机器视觉和人工智能领域,例如目标检测、目标分类、目标识别等。首先,本发明采用均值池化操作对输入图像构建多尺度图像金字塔;然后,将各个不同尺度的图像逐步送入卷积神经网络,让卷积神经网络随着网络深度的逐步深入,能够在多种不同尺度的图像上进行学习并进行特征逐步累加,从提高了而卷积神经网络的特征学习能力。
-
公开(公告)号:CN107371015A
公开(公告)日:2017-11-21
申请号:CN201710600600.5
申请日:2017-07-21
Applicant: 华侨大学
IPC: H04N17/00
CPC classification number: H04N17/004
Abstract: 本发明涉及一种无参考对比度变化图像质量评价方法,充分考虑人类视觉系统对于对比度变化图像的主观感知特性,分别提取四个图像特征:清晰度、信息熵、亮度和对比度;并结合支持向量机SVM(Support Vector Machine)对所提取图像特征进行训练得到对比度变化图像的特征向量与主观质量分数的映射关系模型CCQAM;最后利用训练所得的映射关系模型CCQAM评价对比度变化图像的质量分数。本发明所述的方法计算简单,实用性较强,且与人眼主观质量评价相近,能很好地评价对比度变化图像的质量分数。
-
公开(公告)号:CN106954057A
公开(公告)日:2017-07-14
申请号:CN201710109136.X
申请日:2017-02-27
Applicant: 华侨大学
IPC: H04N13/00 , H04N19/105 , H04N19/172 , H04N19/20
CPC classification number: H04N19/103 , H04N13/10 , H04N19/105 , H04N19/172 , H04N19/20
Abstract: 本发明涉及一种基于视点间相关性的3D‑HEVC帧间预测快速模式选择方法,属于视频编码领域,方法包括记录输入视频独立视点SKIP模式标志;查询非独立视点编码单元在独立视点中的对应位置;通过对应位置和相邻位置SKIP模式标志确定非独立视点中编码单元的最佳模式。本发明一种基于视点间相关性的3D‑HEVC帧间预测快速模式选择方法能够减少编码器的计算开销,在保持编码性能不变的情况下,减少编码时间。
-
公开(公告)号:CN106303521A
公开(公告)日:2017-01-04
申请号:CN201610668684.1
申请日:2016-08-15
Applicant: 华侨大学
IPC: H04N19/105 , H04N19/114 , H04N19/115 , H04N19/147 , H04N19/176
CPC classification number: H04N19/105 , H04N19/114 , H04N19/115 , H04N19/147 , H04N19/176
Abstract: 本发明公开了一种基于感知敏感度的HEVC率失真优化方法,属于视频编码领域,方法包括:获取输入视频各编码块的梯度幅值方差,根据各编码块的梯度幅值方差计算当前帧的梯度幅值方差;有效利用各编码块和当前帧的梯度幅值方差关系计算各编码块的感知敏感度;并根据各编码块感知敏感度获取感知自适应的拉格朗日乘子;由所述拉格朗日乘子计算视频编码中的各编码块的率失真代价,从而确定其最佳编码模式。本发明能够提升编码器整体感知性能,在消耗相同码率的情况下,获得更高感知质量的编码视频。
-
公开(公告)号:CN120075476A
公开(公告)日:2025-05-30
申请号:CN202510541659.6
申请日:2025-04-28
Applicant: 华侨大学
IPC: H04N19/96 , H04N19/597 , H04N19/85 , G06T9/40 , G06N3/0455
Abstract: 本发明公开了一种基于多尺度八叉树注意力机制的点云压缩方法及装置,涉及图像处理领域,包括:编码器网络接收点云数据,利用降尺度特征提取器对点云进行下采样和特征提取,获得降尺度的深层特征点云,通过递归方式将其编码为八叉树,并根据八叉树节点之间的关系构建上下文窗口,引入多头注意力机制对八叉树节点进行特征融合,得到八叉树节点的占用概率,再使用算术编码将其压缩为比特流;解码器网络通过对比特流进行解压缩,获得重建后的点云,利用升尺度特征重建器对其进行上采样和特征重建,最终获得与初始点云相同分辨率的重建点云。本发明能够在保证相同点云质量的前提下,有效提高点云压缩的效率,减少比特开销。
-
公开(公告)号:CN119479047B
公开(公告)日:2025-04-29
申请号:CN202510066012.2
申请日:2025-01-16
Applicant: 华侨大学 , 厦门盈趣科技股份有限公司
IPC: G06V40/16 , G06N3/09 , G06V10/44 , G06V10/762 , G06V10/82
Abstract: 本发明涉及机器学习领域,公开了一种基于宽度学习的半监督多视图聚类集成方法及系统,方法包括以下步骤:构建一种可以依据多视图人脸图像数据进行特征处理的基于宽度学习的自编码器,用于对输入的人脸图像进行特征提取,并基于宽度学习计算不同节点特征的权重;结合基于宽度学习的自编码器和双向约束传播构建聚类集成模型;利用聚类集成模型实现多视图人脸图像的聚类集成。本发明利用宽度学习系统的性能优势进行多视图数据的聚类处理,得到兼具效率与性能的模型网络,引入了流型结构和成对约束,并且在共识过程中采用了约束传播,丰富样本信息,有效提升基于宽度学习的聚类集成网络模型的鲁棒性和准确性,因而在实际场景中更具适用性。
-
公开(公告)号:CN119444804B
公开(公告)日:2025-04-29
申请号:CN202510037837.1
申请日:2025-01-10
Applicant: 华侨大学
Abstract: 本发明涉及图像处理技术领域,提出了一种基于动态自适应和强化特征的多目标跟踪分割方法及系统,方法包括前处理步骤、外观代价计算步骤、预匹配步骤、运动代价计算步骤、正式匹配步骤、后处理步骤、重复步骤和可视化步骤。该方法通过具有动态自适应的数据关联对目标特征进行细化整合,以及利用基于掩码的注意力机制和基于四三角形变的掩码预测分别强化目标外观特征和运动信息,以能够在保持高跟踪精度的同时,实现快速运算和低成本运行,适用于更广泛的应用场景。
-
公开(公告)号:CN119863744A
公开(公告)日:2025-04-22
申请号:CN202510346077.2
申请日:2025-03-24
Applicant: 华侨大学
Abstract: 本发明一种基于六自由度信息引导的沉浸式视频质量评价方法及装置,涉及计算机视觉领域,方法包括:构建基于六自由度信息引导的沉浸式视频质量评价模型并训练,得到经训练的评价模型;从沉浸式视频提取纹理视频块、纹理关键帧和深度关键帧;将纹理视频块、纹理关键帧和深度关键帧输入经训练的评价模型,通过视觉信息编码模块提取到对应的视觉特征;将视觉特征输入时空映射模块得到时间视觉标记和空间视觉标记;通过语言编码器对指令信息和六自由度视点位置信息进行编码,得到文本指令标记和视点位置标记;将各标记进行组合得到组合标记,将组合标记输入语音解码器中,得到沉浸式视频质量分数。本发明能够准确客观评估沉浸式视频的质量。
-
-
-
-
-
-
-
-
-