-
公开(公告)号:CN118381920A
公开(公告)日:2024-07-23
申请号:CN202410807401.1
申请日:2024-06-21
Applicant: 华侨大学
IPC: H04N19/147 , G06V10/80 , G06V10/44 , G06V10/54
Abstract: 本发明公开了一种基于联合特征的MIV沉浸式视频率失真优化方法,涉及视频编码领域,包括:计算像素的几何失真权重;将帧内划分为纹理区域与深度区域,提取纹理区域的纹理复杂度特征、纹理区域的边缘特征和深度区域的边缘特征,自适应融合纹理区域的边缘特征和深度区域的边缘特征以得到融合边缘特征;使用纹理复杂度特征与融合边缘特征组成的联合特征,计算得到纹理区域的失真度量缩放因子与深度区域的失真度量缩放因子;根据纹理区域的失真度量缩放因子、失真度量缩放因子和几何失真权重计算新拉格朗日乘子;基于新拉格朗日乘子实现沉浸式视频的率失真优化。本发明可以使得最终渲染的沉浸式视频具有更好的渲染质量与率失真性能。
-
公开(公告)号:CN118379777A
公开(公告)日:2024-07-23
申请号:CN202410807403.0
申请日:2024-06-21
Applicant: 华侨大学
IPC: G06V40/16 , G06N3/0442 , G06N3/0475 , G06N3/094 , G06V10/774 , G06V10/82 , G06V20/40 , G06V40/20 , G10L21/10
Abstract: 本发明公开了一种基于姿势对抗网络的人脸视频生成方法及系统,涉及图像处理技术领域,方法包括:构建人脸视频生成模型,包括图像编码器、音频编码器、头部运动预测模块、姿势编码器和解码器,所述人脸视频生成模型接收人脸图像和语音音频,生成人脸说话视频;获取训练数据集并对人脸视频生成模型进行预训练;构建唇型同步判别器作为判别器,对预训练人脸视频生成模型进行生成对抗训练;利用训练好的人脸视频生成模型实现人脸视频生成。本发明利用音频信号的动态特性对头部运动进行建模,并结合生成对抗网络与唇型同步判别器提高人脸视频的唇形同步精度,同时兼顾视频的逼真度,使得其更加真实、自然,从而为各种应用场景提供了更多的灵活性。
-
公开(公告)号:CN119991973A
公开(公告)日:2025-05-13
申请号:CN202510480150.5
申请日:2025-04-17
Applicant: 华侨大学
IPC: G06T17/00
Abstract: 本发明公开了一种基于多尺度高斯球的动态场景重建方法及装置,涉及计算机视觉领域,包括:采用运动恢复结构算法对待重建的视频帧序列进行处理,生成稀疏点云,对稀疏点云进行初始化,生成3D高斯球集合;采用双域变形模型和自适应时间戳对3D高斯球集合进行处理,得到变形的3D高斯球集合;对变形的3D高斯球集合进行多尺度高斯处理,生成多尺度高斯球集合;对多尺度高斯球集合进行基于像素覆盖率的高斯筛选,得到优化后的多尺度高斯球集合;基于优化后的多尺度高斯球集合进行Alpha混合处理,重建得到抗锯齿动态渲染场景图像。本发明解决了目前动态场景重建的计算开销大且存在混叠效应等问题。
-
公开(公告)号:CN119561791B
公开(公告)日:2025-04-22
申请号:CN202510114211.6
申请日:2025-01-24
Applicant: 华侨大学
IPC: H04L9/40 , G06N3/0455 , G06F18/2433
Abstract: 本发明涉及入侵流量检测领域,公开了一种基于宽度网络的集成单分类异常流量检测方法及系统,方法包括如下步骤:采样步骤,根据采样概率抽取一定比例的正常数据;训练步骤,利用所述正常数据训练宽度自编码网络,作为弱分类器;更新步骤,根据样本重构误差计算当前弱分类器的置信度,并更新样本的采样概率;集成步骤,重复采样步骤至更新步骤,直到获得若干个弱分类器,集成获得异常流量检测模型;检测步骤,利用异常流量检测模型对未知样本进行异常检测,得到多个弱分类器的异常检测结果,根据弱分类的置信度对异常检测结果加权得到最终的检测结果。本发明将宽度学习自编码网络应用在单分类问题,解决了深度网络训练慢、消耗内存大等问题。
-
公开(公告)号:CN119741304A
公开(公告)日:2025-04-01
申请号:CN202510262624.9
申请日:2025-03-06
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
Abstract: 本发明公开了一种基于三维人脸几何结构的无参考质量评估方法及装置,涉及计算机视觉领域,方法包括:三维人脸网格模型重建;计算映射关键点和提取关键点之间的欧几里得距离,获得几何一致性分数;用三维人脸分割算法划分人脸区域,计算高斯曲率得到区域曲率分数;计算模型表面的平滑度,检测模型表面是否存在不自然的突起或瑕疵,获得平滑度分数;将几何一致性分数、区域曲率分数和平滑度分数按照加权比例进行融合,输出三维人脸网格模型的综合质量分数。本发明无需依赖数据库中的标准人脸模型,能够基于人脸几何特征和区域性分析对单个重建的三维人脸网格模型质量进行全面评估,适用于智能美容、精准医疗等个性化重建场景。
-
公开(公告)号:CN119561791A
公开(公告)日:2025-03-04
申请号:CN202510114211.6
申请日:2025-01-24
Applicant: 华侨大学
IPC: H04L9/40 , G06N3/0455 , G06F18/2433
Abstract: 本发明涉及入侵流量检测领域,公开了一种基于宽度网络的集成单分类异常流量检测方法及系统,方法包括如下步骤:采样步骤,根据采样概率抽取一定比例的正常数据;训练步骤,利用所述正常数据训练宽度自编码网络,作为弱分类器;更新步骤,根据样本重构误差计算当前弱分类器的置信度,并更新样本的采样概率;集成步骤,重复采样步骤至更新步骤,直到获得若干个弱分类器,集成获得异常流量检测模型;检测步骤,利用异常流量检测模型对未知样本进行异常检测,得到多个弱分类器的异常检测结果,根据弱分类的置信度对异常检测结果加权得到最终的检测结果。本发明将宽度学习自编码网络应用在单分类问题,解决了深度网络训练慢、消耗内存大等问题。
-
公开(公告)号:CN119479047A
公开(公告)日:2025-02-18
申请号:CN202510066012.2
申请日:2025-01-16
Applicant: 华侨大学 , 厦门盈趣科技股份有限公司
IPC: G06V40/16 , G06N3/09 , G06V10/44 , G06V10/762 , G06V10/82
Abstract: 本发明涉及机器学习领域,公开了一种基于宽度学习的半监督多视图聚类集成方法及系统,方法包括以下步骤:构建一种可以依据多视图人脸图像数据进行特征处理的基于宽度学习的自编码器,用于对输入的人脸图像进行特征提取,并基于宽度学习计算不同节点特征的权重;结合基于宽度学习的自编码器和双向约束传播构建聚类集成模型;利用聚类集成模型实现多视图人脸图像的聚类集成。本发明利用宽度学习系统的性能优势进行多视图数据的聚类处理,得到兼具效率与性能的模型网络,引入了流型结构和成对约束,并且在共识过程中采用了约束传播,丰富样本信息,有效提升基于宽度学习的聚类集成网络模型的鲁棒性和准确性,因而在实际场景中更具适用性。
-
公开(公告)号:CN119229130A
公开(公告)日:2024-12-31
申请号:CN202411736952.X
申请日:2024-11-29
Applicant: 华侨大学
IPC: G06V10/26 , G06N3/0464 , G06V10/44 , G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种基于分类激活映射自举的路面裂痕分割方法及装置,涉及人工智能、机器视觉领域,方法包括:训练基于深度网络的正常与裂痕路面分类模型;利用类激活映射方法生成路面图像的激活映射图,通过高激活阈值筛选出类别高激活掩码并进行增强操作后,加入路面图像训练集;重复上述步骤,直到达到设定条件;基于训练好的正常与裂痕路面分类模型生成待推理的路面图像的激活映射图,通过裂痕掩码阈值获得待推理的路面图像的裂痕掩码,作为裂痕分割结果。本发明利用分类模型与激活映射,寻找类别高激活掩码更新路面图像训练集,不断迭代优化掩码效果,以改善路面裂痕分割效果,无需对裂痕进行像素级的标注,大大降低了标注成本。
-
公开(公告)号:CN119228788A
公开(公告)日:2024-12-31
申请号:CN202411725027.7
申请日:2024-11-28
Applicant: 华侨大学
IPC: G06T7/00 , G06N3/0455 , G06N3/08 , G06V10/26 , G06V10/40 , G06V10/764 , G06V10/82 , G01R31/12 , G01N21/88
Abstract: 本发明公开了一种基于类别余弦映射的绝缘子故障检测方法及装置,涉及人工智能、机器视觉领域,包括:从真实数据集合与合成数据集合中获取图像数据、故障标签以及类别标签;利用类别余弦偏置编码将类别偏置编码进图像数据,利用特征提取网络提取编码结果中的空间特征;利用类别余弦偏置解码缓解空间特征中的偏置信息以获得类别特征,利用多标签分类器获取类别特征与类别标签的分类损失;利用分割解码器获取空间特征与故障标签的掩码损失;基于分类损失与掩码损失完成模型训练。本发明将正常、故障绝缘子以及合成图像的类别差异通过余弦偏置编码至图像数据中,引导模型理解合成图像与真实场景中的分布差异,最终提升合成数据在实践中的有效性。
-
公开(公告)号:CN119027845A
公开(公告)日:2024-11-26
申请号:CN202411514321.3
申请日:2024-10-29
Applicant: 华侨大学 , 泉州圣源警用侦察设备有限公司
IPC: G06V20/17 , G06V10/25 , G06V10/764 , G06V10/77 , G06V10/774 , G06V10/80
Abstract: 本发明涉及图像处理与人工智能技术领域,公开了一种无人机森林火灾风险区块检测方法及系统,方法包括:构建基于区块分类的目标检测模型并进行训练,利用训练好的基于区块分类的目标检测模型实现无人机森林火灾风险区块检测;所述基于区块分类的目标检测模型利用区块映射器无人机图像中的不同区块映射为区块特征;利用多阶段采样网络对区块特征进行多种尺度的采样,并利用降维映射层进行尺度对齐,获得多尺度区块特征;通过哈达玛积融合多尺度区块特征,利用区块分类器将融合后的多尺度区块特征映射至区块类别概率。本发明以区域分类方式实现风险区块的定位,避免了现有技术因精确定位导致的庞大计算量,延长无人机可用时间。
-
-
-
-
-
-
-
-
-