-
公开(公告)号:CN115424168A
公开(公告)日:2022-12-02
申请号:CN202210975931.8
申请日:2022-08-15
Applicant: 华侨大学
Abstract: 本发明公开了一种基于自适应3D卷积的屏幕视频质量评价方法及装置,获取屏幕视频,基于局部视频活动度Γ(Px,y,t)对屏幕视频进行自适应分割,得到屏幕视频序列集合,屏幕视频包括参考屏幕视频和失真屏幕视频,屏幕视频序列集合包括参考屏幕视频序列集合和失真屏幕视频序列集合;通过3D卷积神经网络分别提取参考屏幕视频序列集合的参考时空卷积特征STr以及失真屏幕视频序列集合的失真时空卷积特征STd;采用双尺度卷积神经网络对参考时空卷积特征STr和失真时空卷积特征STd实现双通道时空特征融合,计算得到失真屏幕视频的质量评价分数。着重于考虑人眼视觉系统特性及屏幕视频本质信息,模拟人类视觉系统的多通道视觉处理过程,从不同角度实现对失真屏幕视频的质量预测。
-
公开(公告)号:CN114817596A
公开(公告)日:2022-07-29
申请号:CN202210390000.1
申请日:2022-04-14
Applicant: 华侨大学
IPC: G06F16/532 , G06F16/583 , G06V10/80 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种融合语义相似性嵌入和度量学习的跨模态图文检索方法,具体包括:首先构建特征嵌入模块抽取每个模态的深度特征,然后在图像和文本的单模态表征空间和跨模态公共表征空间通过标签域监督信息和语义一致性监督信息分别进行表征学习。同时,设计一个深度相似性度量网络对融合后的图像文本对进行相似性比较,得到相似性得分,通过语义相似性矩阵监督相似性学习。通过损失函数将模型统一到一个整体的框架内,训练可得到端到端的跨模态图文检索模型。通过实验表明,本发明能够有效解决跨模态图文检索中精确度不高的问题。
-
公开(公告)号:CN114710667A
公开(公告)日:2022-07-05
申请号:CN202210269314.6
申请日:2022-03-18
Applicant: 华侨大学
IPC: H04N19/107 , H04N19/11 , H04N19/96
Abstract: 本发明公开了一种针对H.266/VVC屏幕内容帧内CU划分的快速预测方法及装置,通过收集屏幕内容视频建立数据库,用于训练模型;构建宽度自适应网络模型,预测两种不同尺寸CU的划分方式,预测步骤如下:先采用网络模型对64×64大小的CU进行划分方式预测,若为不划分,则停止CU的RD代价计算,若为划分,则得到4个32×32大小的CU,则采用网络模型对32×32大小的CU的划分方式进行预测,若为不划分,则停止RD的代价计算,若为四叉树划分,则得到4个16×16的CU:若为多种类型叉树划分,则需要依靠标准编码器进行计算;最后设定适当的预设阈值来提高预测准确率。本发明能够在保持H.266/VVC编码效率的前提下,有效地降低H.266/VVC屏幕内容的帧内预测编码计算复杂度。
-
公开(公告)号:CN119991973A
公开(公告)日:2025-05-13
申请号:CN202510480150.5
申请日:2025-04-17
Applicant: 华侨大学
IPC: G06T17/00
Abstract: 本发明公开了一种基于多尺度高斯球的动态场景重建方法及装置,涉及计算机视觉领域,包括:采用运动恢复结构算法对待重建的视频帧序列进行处理,生成稀疏点云,对稀疏点云进行初始化,生成3D高斯球集合;采用双域变形模型和自适应时间戳对3D高斯球集合进行处理,得到变形的3D高斯球集合;对变形的3D高斯球集合进行多尺度高斯处理,生成多尺度高斯球集合;对多尺度高斯球集合进行基于像素覆盖率的高斯筛选,得到优化后的多尺度高斯球集合;基于优化后的多尺度高斯球集合进行Alpha混合处理,重建得到抗锯齿动态渲染场景图像。本发明解决了目前动态场景重建的计算开销大且存在混叠效应等问题。
-
公开(公告)号:CN119359547B
公开(公告)日:2025-05-02
申请号:CN202411936474.7
申请日:2024-12-26
Applicant: 华侨大学
IPC: G06T3/4053 , G06N3/0464 , G06N3/0495 , G06T3/4046
Abstract: 本发明设计图像处理技术领域,公开了一种基于特征蒸馏和层间信息交互的轻量级图像超分辨率方法,包括以下步骤:构建动态非对称蒸馏模块和层间全维信息交互模块;基于动态非对称蒸馏模块和层间全维信息交互模块构建轻量级图像超分辨率网络;利用所述轻量级图像超分辨率网络实现图像超分辨率;其中,所述轻量级图像超分辨率网络利用卷积层对输入的低分辨率图像进行浅层特征提取,利用动态非对称蒸馏模块和层间全维信息交互模块对浅层特征进行深层特征提取,利用卷积层和上采样对深层特征进行图像重建,得到高分辨率图像。本发明以更轻量、更有效的方式提取关键特征,从而实现在提升重建效果的同时,最小化计算开销和参数量。
-
公开(公告)号:CN119561791B
公开(公告)日:2025-04-22
申请号:CN202510114211.6
申请日:2025-01-24
Applicant: 华侨大学
IPC: H04L9/40 , G06N3/0455 , G06F18/2433
Abstract: 本发明涉及入侵流量检测领域,公开了一种基于宽度网络的集成单分类异常流量检测方法及系统,方法包括如下步骤:采样步骤,根据采样概率抽取一定比例的正常数据;训练步骤,利用所述正常数据训练宽度自编码网络,作为弱分类器;更新步骤,根据样本重构误差计算当前弱分类器的置信度,并更新样本的采样概率;集成步骤,重复采样步骤至更新步骤,直到获得若干个弱分类器,集成获得异常流量检测模型;检测步骤,利用异常流量检测模型对未知样本进行异常检测,得到多个弱分类器的异常检测结果,根据弱分类的置信度对异常检测结果加权得到最终的检测结果。本发明将宽度学习自编码网络应用在单分类问题,解决了深度网络训练慢、消耗内存大等问题。
-
公开(公告)号:CN119741304A
公开(公告)日:2025-04-01
申请号:CN202510262624.9
申请日:2025-03-06
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
Abstract: 本发明公开了一种基于三维人脸几何结构的无参考质量评估方法及装置,涉及计算机视觉领域,方法包括:三维人脸网格模型重建;计算映射关键点和提取关键点之间的欧几里得距离,获得几何一致性分数;用三维人脸分割算法划分人脸区域,计算高斯曲率得到区域曲率分数;计算模型表面的平滑度,检测模型表面是否存在不自然的突起或瑕疵,获得平滑度分数;将几何一致性分数、区域曲率分数和平滑度分数按照加权比例进行融合,输出三维人脸网格模型的综合质量分数。本发明无需依赖数据库中的标准人脸模型,能够基于人脸几何特征和区域性分析对单个重建的三维人脸网格模型质量进行全面评估,适用于智能美容、精准医疗等个性化重建场景。
-
公开(公告)号:CN119561791A
公开(公告)日:2025-03-04
申请号:CN202510114211.6
申请日:2025-01-24
Applicant: 华侨大学
IPC: H04L9/40 , G06N3/0455 , G06F18/2433
Abstract: 本发明涉及入侵流量检测领域,公开了一种基于宽度网络的集成单分类异常流量检测方法及系统,方法包括如下步骤:采样步骤,根据采样概率抽取一定比例的正常数据;训练步骤,利用所述正常数据训练宽度自编码网络,作为弱分类器;更新步骤,根据样本重构误差计算当前弱分类器的置信度,并更新样本的采样概率;集成步骤,重复采样步骤至更新步骤,直到获得若干个弱分类器,集成获得异常流量检测模型;检测步骤,利用异常流量检测模型对未知样本进行异常检测,得到多个弱分类器的异常检测结果,根据弱分类的置信度对异常检测结果加权得到最终的检测结果。本发明将宽度学习自编码网络应用在单分类问题,解决了深度网络训练慢、消耗内存大等问题。
-
公开(公告)号:CN119479047A
公开(公告)日:2025-02-18
申请号:CN202510066012.2
申请日:2025-01-16
Applicant: 华侨大学 , 厦门盈趣科技股份有限公司
IPC: G06V40/16 , G06N3/09 , G06V10/44 , G06V10/762 , G06V10/82
Abstract: 本发明涉及机器学习领域,公开了一种基于宽度学习的半监督多视图聚类集成方法及系统,方法包括以下步骤:构建一种可以依据多视图人脸图像数据进行特征处理的基于宽度学习的自编码器,用于对输入的人脸图像进行特征提取,并基于宽度学习计算不同节点特征的权重;结合基于宽度学习的自编码器和双向约束传播构建聚类集成模型;利用聚类集成模型实现多视图人脸图像的聚类集成。本发明利用宽度学习系统的性能优势进行多视图数据的聚类处理,得到兼具效率与性能的模型网络,引入了流型结构和成对约束,并且在共识过程中采用了约束传播,丰富样本信息,有效提升基于宽度学习的聚类集成网络模型的鲁棒性和准确性,因而在实际场景中更具适用性。
-
公开(公告)号:CN119229130A
公开(公告)日:2024-12-31
申请号:CN202411736952.X
申请日:2024-11-29
Applicant: 华侨大学
IPC: G06V10/26 , G06N3/0464 , G06V10/44 , G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种基于分类激活映射自举的路面裂痕分割方法及装置,涉及人工智能、机器视觉领域,方法包括:训练基于深度网络的正常与裂痕路面分类模型;利用类激活映射方法生成路面图像的激活映射图,通过高激活阈值筛选出类别高激活掩码并进行增强操作后,加入路面图像训练集;重复上述步骤,直到达到设定条件;基于训练好的正常与裂痕路面分类模型生成待推理的路面图像的激活映射图,通过裂痕掩码阈值获得待推理的路面图像的裂痕掩码,作为裂痕分割结果。本发明利用分类模型与激活映射,寻找类别高激活掩码更新路面图像训练集,不断迭代优化掩码效果,以改善路面裂痕分割效果,无需对裂痕进行像素级的标注,大大降低了标注成本。
-
-
-
-
-
-
-
-
-