-
公开(公告)号:CN106954057B
公开(公告)日:2018-08-28
申请号:CN201710109136.X
申请日:2017-02-27
Applicant: 华侨大学
IPC: H04N13/00 , H04N19/105 , H04N19/172 , H04N19/20
Abstract: 本发明涉及一种基于视点间相关性的3D‑HEVC帧间预测快速模式选择方法,属于视频编码领域,方法包括记录输入视频独立视点SKIP模式标志;查询非独立视点编码单元在独立视点中的对应位置;通过对应位置和相邻位置SKIP模式标志确定非独立视点中编码单元的最佳模式。本发明一种基于视点间相关性的3D‑HEVC帧间预测快速模式选择方法能够减少编码器的计算开销,在保持编码性能不变的情况下,减少编码时间。
-
公开(公告)号:CN104967855B
公开(公告)日:2018-01-16
申请号:CN201510356968.2
申请日:2015-06-25
Applicant: 华侨大学
IPC: H04N19/503
Abstract: 本发明一种适用于监控视频的编码方法,首先,利用背景建模技术建立背景帧;其次,把视频帧分割为前景区域和背景区域,并进行背景替换,把视频帧的背景区域替换成背景帧的对应区域,即空间位置相同的区域;最后把背景替换后的监控视频帧送入编码器进行编码。由于相邻两帧之间背景区域的各像素值相同,在帧间编码时,编码器无需对背景区域进行编码。因此,本发明可在保证前景目标客观质量的前提下,大大提高监控视频编码的压缩效率,降低编码的计算复杂度,可广泛地应用于视频监控系统。
-
公开(公告)号:CN106973292A
公开(公告)日:2017-07-21
申请号:CN201710109148.2
申请日:2017-02-27
Applicant: 华侨大学
IPC: H04N19/103 , H04N19/105 , H04N19/172 , H04N19/20 , H04N13/00
CPC classification number: H04N19/103 , H04N13/10 , H04N19/105 , H04N19/172 , H04N19/20
Abstract: 本发明涉及一种基于彩色图像纹理特性的3D‑HEVC帧间预测快速模式选择方法,属于视频编码领域,方法包括分析编码单元纹理特性;判断编码单元纹理特性;根据判断结果决定是否跳过对称分割和非对称分割预测模式。本发明一种基于彩色图像纹理特性的3D‑HEVC帧间预测快速模式选择方法能够减少编码器的计算开销,在保持编码性能不变的情况下,减少编码时间。
-
公开(公告)号:CN105320956A
公开(公告)日:2016-02-10
申请号:CN201510661393.5
申请日:2015-10-14
Applicant: 华侨大学
IPC: G06K9/46
CPC classification number: G06K9/4642
Abstract: 本发明公开了一种基于中心窗口变差的四象限分块模式的图像纹理特征提取方法,对任一2M×2N像素的图像区域,首先计算其中心部分M×N个像素值的和作为阈值,然后把该2M×2N像素的图像区域分解为4个M×N像素的子区域,再分别计算这4个子区域像素值的和并与阈值进行比较,若像素值的和大于或等于阈值,就置该子区域的位置编码值为1,否则为0;最后将四个子区域的位置编码值乘以对应的权重后进行求和,得到该2M×2N像素的图像区域的纹理特征值。本发明只需要用4个比特就能有效地表示物体的局部纹理信息,可应用于目标检测、识别和跟踪。
-
公开(公告)号:CN103366187A
公开(公告)日:2013-10-23
申请号:CN201310279042.9
申请日:2013-07-04
Applicant: 华侨大学
Abstract: 本发明提出一种基于四点二元模型的图像纹理特征值的提取方法,首先计算2x2像素块内四个像素点像素值的均值;其次计算每个像素点与均值的差值,若差值大于等于一给定阈值,就置该像素块的位置编码值为1,否则为0;最后将四个像素块的位置编码值乘以相对应的权重后,再将4个乘积求和,就得到该2x2像素块的纹理特征值,本发明只需要计算四个像素点与其均值的差值,得到4bit的二进制码,计算量减少一半且复杂度低,且能有效地表示人脸的局部纹理信息,可应用于人脸检测、识别和目标跟踪系统。
-
公开(公告)号:CN119228788B
公开(公告)日:2025-02-18
申请号:CN202411725027.7
申请日:2024-11-28
Applicant: 华侨大学
IPC: G06T7/00 , G06N3/0455 , G06N3/08 , G06V10/26 , G06V10/40 , G06V10/764 , G06V10/82 , G01R31/12 , G01N21/88
Abstract: 本发明公开了一种基于类别余弦映射的绝缘子故障检测方法及装置,涉及人工智能、机器视觉领域,包括:从真实数据集合与合成数据集合中获取图像数据、故障标签以及类别标签;利用类别余弦偏置编码将类别偏置编码进图像数据,利用特征提取网络提取编码结果中的空间特征;利用类别余弦偏置解码缓解空间特征中的偏置信息以获得类别特征,利用多标签分类器获取类别特征与类别标签的分类损失;利用分割解码器获取空间特征与故障标签的掩码损失;基于分类损失与掩码损失完成模型训练。本发明将正常、故障绝缘子以及合成图像的类别差异通过余弦偏置编码至图像数据中,引导模型理解合成图像与真实场景中的分布差异,最终提升合成数据在实践中的有效性。
-
公开(公告)号:CN119229130B
公开(公告)日:2025-02-14
申请号:CN202411736952.X
申请日:2024-11-29
Applicant: 华侨大学
IPC: G06V10/26 , G06N3/0464 , G06V10/44 , G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种基于分类激活映射自举的路面裂痕分割方法及装置,涉及人工智能、机器视觉领域,方法包括:训练基于深度网络的正常与裂痕路面分类模型;利用类激活映射方法生成路面图像的激活映射图,通过高激活阈值筛选出类别高激活掩码并进行增强操作后,加入路面图像训练集;重复上述步骤,直到达到设定条件;基于训练好的正常与裂痕路面分类模型生成待推理的路面图像的激活映射图,通过裂痕掩码阈值获得待推理的路面图像的裂痕掩码,作为裂痕分割结果。本发明利用分类模型与激活映射,寻找类别高激活掩码更新路面图像训练集,不断迭代优化掩码效果,以改善路面裂痕分割效果,无需对裂痕进行像素级的标注,大大降低了标注成本。
-
公开(公告)号:CN118334733A
公开(公告)日:2024-07-12
申请号:CN202410757576.6
申请日:2024-06-13
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
IPC: G06V40/16 , G06N3/0464 , G06N3/048 , G06N3/08 , G06V10/764 , G06V10/80 , G06V10/82
Abstract: 本发明公开了一种基于池化正交融合的面部色素斑分类方法及装置,涉及图像识别领域,包括:构建面部色素斑分类模型并训练,得到经训练的面部色素斑分类模型,面部色素斑分类模型中,利用深度骨干网络对色素斑图像进行特征提取,得到特征映射,池化正交融合模块中,先验平均池化分支用于提取特征映射中的空间全局信息,获得具有空间稳定性的先验池化特征,后验可学习池化分支借助可学习权重挖掘特征映射中的空间分布信息,获得空间敏感性的后验可学习池化特征,利用正交融合模块对先验池化特征和后验可学习池化特征进行正交融合,得到正交融合特征并输入到第一全连接层和Softmax函数层,输出预测类别概率。本发明解决散射分布斑点分类难的问题。
-
公开(公告)号:CN114972812B
公开(公告)日:2024-06-18
申请号:CN202210624115.2
申请日:2022-06-02
Applicant: 华侨大学 , 厦门亿联网络技术股份有限公司
IPC: G06V10/74 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种基于结构相似度的非局部注意力学习方法,可广泛应用于机器视觉领域,例如图像分割、图像分类、图像识别等。现有非局部注意力方法简单计算不同空域位置的两个信号内积作为二者的相似度度量,并不完全符合人类视觉感知特点。针对这一问题,本发明提出利用结构相似度衡量不同空域位置的信号之间的相似度,在非局部注意力学习方法中充分考虑人类视觉对信号感知三个重要因素,即亮度、对比度和结构。其次,本发明进一步提出多尺度结构相似度度量策略,在不同尺度上更为全面地进行信号相似度度量。因此,本发明能够取得比现有非局部注意力方法更好地注意力学习效果。
-
公开(公告)号:CN117456561A
公开(公告)日:2024-01-26
申请号:CN202311779478.4
申请日:2023-12-22
Applicant: 华侨大学
IPC: G06V40/10 , G06V10/44 , G06V10/77 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N10/20 , G06N10/60
Abstract: 本发明公开一种基于部件量子学习的行人再辨识方法,涉及量子计算、人工智能领域,包括:用深度神经网络从行人图像中提取特征映射,并用自适应空间平均池化把特征映射分解为多个部件特征;用多分支通道型量子卷积网络,每个分支对应从一个部件特征上进行量子学习,获得部件量子特征;把所有部件量子特征求和并输入通道型量子卷积网络进行部件量子特征融合,获得最终的行人特征向量,用于行人再辨识。本发明利用量子叠加与纠缠特性实现行人特征学习,能提高特征学习效果,进而提升行人再辨识的准确率。
-
-
-
-
-
-
-
-
-