-
公开(公告)号:CN118379777A
公开(公告)日:2024-07-23
申请号:CN202410807403.0
申请日:2024-06-21
Applicant: 华侨大学
IPC: G06V40/16 , G06N3/0442 , G06N3/0475 , G06N3/094 , G06V10/774 , G06V10/82 , G06V20/40 , G06V40/20 , G10L21/10
Abstract: 本发明公开了一种基于姿势对抗网络的人脸视频生成方法及系统,涉及图像处理技术领域,方法包括:构建人脸视频生成模型,包括图像编码器、音频编码器、头部运动预测模块、姿势编码器和解码器,所述人脸视频生成模型接收人脸图像和语音音频,生成人脸说话视频;获取训练数据集并对人脸视频生成模型进行预训练;构建唇型同步判别器作为判别器,对预训练人脸视频生成模型进行生成对抗训练;利用训练好的人脸视频生成模型实现人脸视频生成。本发明利用音频信号的动态特性对头部运动进行建模,并结合生成对抗网络与唇型同步判别器提高人脸视频的唇形同步精度,同时兼顾视频的逼真度,使得其更加真实、自然,从而为各种应用场景提供了更多的灵活性。
-
公开(公告)号:CN118155731A
公开(公告)日:2024-06-07
申请号:CN202410311105.2
申请日:2024-03-19
Applicant: 华侨大学 , 厦门盈趣科技股份有限公司
IPC: G16B40/30 , G06F18/23 , G06N3/0455 , G06N3/08 , G06N7/02
Abstract: 本发明公开了一种基于宽度学习的多视图的癌症基因数据聚类集成方法及装置,包括:构建自编码器模型,确定经训练的子空间自表达结构的系数矩阵,基于该系数矩阵对自编码器模型进行训练,多视图的癌症基因数据输入经训练的自编码器模型,得到特征处理后的样本矩阵;对特征处理后的样本矩阵进行聚类,得到多个基础聚类结果并作为集成池中的集成成员,以构建模糊划分矩阵和置信度矩阵;构建基于第二宽度学习网络的聚类集成模型,对聚类集成模型进行训练,得到经训练的聚类集成模型,将模糊划分矩阵输入经训练的聚类集成模型,得到软集成结果,对软集成结果进行聚类,得到多视图的癌症基因数据的聚类结果,有效提升网络模型的鲁棒性和准确性。
-
公开(公告)号:CN117440158B
公开(公告)日:2024-04-12
申请号:CN202311759886.3
申请日:2023-12-20
Applicant: 华侨大学
IPC: H04N19/147 , H04N19/154
Abstract: 本发明公开了一种基于三维几何失真的MIV沉浸式视频编码率失真优化方法,涉及视频编码领域,包括:S1,基于MIV编码平台编码沉浸式视频序列,生成图集后,计算与深度映射范围系数;S2,使用支持MIV标准的二维视频编码器编码沉浸式视频几何图集时,构建三维几何失真与均方误差的关系模型;S3,根据三维几何失真与均方误差的关系模型,计算三维几何失真系数;S4,根据三维几何失真系数,计算率失真优化模型中新的拉格朗日乘子,基于调整后的率失真优化模型编码当前CTU,以改善沉浸式视频渲染质量的率失真性能。本发明最终渲染的沉浸式视频质量与码率的率失真性能更好。
-
公开(公告)号:CN117456480B
公开(公告)日:2024-03-29
申请号:CN202311769679.6
申请日:2023-12-21
Applicant: 华侨大学 , 星宸科技股份有限公司
IPC: G06V20/54 , G06V10/74 , G06V10/82 , G06N3/0464 , G06N3/09
Abstract: 本发明公开了一种基于多源信息融合的轻量化车辆再辨识方法,涉及计算机视觉与机器学习技术领域,包括:构建神经网络;所述神经网络包括依次连接的ResNet50网络、局部特征融合网络和混合注意力模块;使用监督对比损失和多源信息识别损失对神经网络进行联合训练,直至收敛,得到教师网络;选取计算量和参数量比教师网络均小的模型作为学生网络;通过知识蒸馏,对学生网络进行监督,训练直至收敛,得到轻量化的车辆再辨识模型;基于轻量化的车辆再辨识模型,输出再辨识结果。本发明利用多源信息融合的方式协调不同传感器数据以提高再辨识性能,并辅以知识蒸馏,实现在有限的计算资源下,实现高质量的再辨识,从而为各种应用场景提供了更多的灵活性。
-
公开(公告)号:CN117422614B
公开(公告)日:2024-03-12
申请号:CN202311745925.4
申请日:2023-12-19
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
IPC: G06T3/40 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06V10/42 , G06V10/44
Abstract: 本发明公开了一种基于混合特征交互Transformer的单帧图像超分辨率方法及装置,涉及图像处理领域,包括:获取待重建的低分辨率图像;构建基于混合特征交互Transformer的单帧图像超分辨率模型并训练,得到经训练的单帧图像超分辨率模型,单帧图像超分辨率模型包括依次连接的浅层特征提取单元、深层特征提取单元和上采样重建单元,深层特征提取单元包括依次连接的P个混合特征交互Transformer模块;将低分辨率图像输入经训练的单帧图像超分辨率模型,通过浅层特征提取单元提取浅层特征,将浅层特征输入深层特征提取单元提取得到深层特征,将深层特征输入上采样重建单元,重建得到高分辨率重建图像,解决Transformer的SR方法忽略不同维度的特征之间的潜在关联性,影响重建性能的问题。
-
公开(公告)号:CN117196960B
公开(公告)日:2024-03-01
申请号:CN202311475299.1
申请日:2023-11-08
Applicant: 华侨大学
IPC: G06T3/4053 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06V10/80
Abstract: 本发明公开了一种全尺度特征细化轻量级图像超分辨率方法及装置,涉及图像处理领域,该方法包括:构建全尺度特征细化轻量级图像超分辨率模型并训练,得到经训练的全尺度特征细化轻量级图像超分辨率模型,将低分辨率图像输入经训练的全尺度特征细化轻量级图像超分辨率模型,先经过第一卷积层得到第一特征图,第一特征图经过串联的K个特征蒸馏提取模块,每一个特征蒸馏提取模块的输出均传送至第二卷积层,并经过第三卷积层,得到第二特征图,第二特征图与第一特征图相加,得到最终特征图,最终特征图输入上采样模块,重建得到高分辨率图
-
公开(公告)号:CN117422614A
公开(公告)日:2024-01-19
申请号:CN202311745925.4
申请日:2023-12-19
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
IPC: G06T3/40 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06V10/42 , G06V10/44
Abstract: 本发明公开了一种基于混合特征交互Transformer的单帧图像超分辨率方法及装置,涉及图像处理领域,包括:获取待重建的低分辨率图像;构建基于混合特征交互Transformer的单帧图像超分辨率模型并训练,得到经训练的单帧图像超分辨率模型,单帧图像超分辨率模型包括依次连接的浅层特征提取单元、深层特征提取单元和上采样重建单元,深层特征提取单元包括依次连接的P个混合特征交互Transformer模块;将低分辨率图像输入经训练的单帧图像超分辨率模型,通过浅层特征提取单元提取浅层特征,将浅层特征输入深层特征提取单元提取得到深层特征,将深层特征输入上采样重建单元,重建得到高分辨率重建图像,解决Transformer的SR方法忽略不同维度的特征之间的潜在关联性,影响重建性能的问题。
-
公开(公告)号:CN117036911A
公开(公告)日:2023-11-10
申请号:CN202311301590.7
申请日:2023-10-10
Applicant: 华侨大学 , 星宸科技股份有限公司 , 厦门瑞为信息技术有限公司
IPC: G06V10/82 , G06N3/0464 , G06N3/08 , G06V10/74
Abstract: 本发明公开了一种基于神经架构搜索的车辆再辨识轻量化方法及系统,涉及计算机视觉与机器学习技术领域,方法包括:S1,构建网络模型,给定硬件约束以生成对应的架构生成器,利用测试集训练架构生成器;S2,将硬件约束输入到架构生成器,得到多个轻量化神经网络架构模型;S3,采集车辆再辨识数据并进行数据增强;S4,利用车辆再辨识数据集对轻量化神经网络架构模型进行训练及验证,选择效果最好的作为轻量化车辆再辨识网络;S5,基于轻量化车辆再辨识网络进行车辆再辨识。本发明利用神经架构搜索自适应地依据硬件约束进行神经网络的搭建,得到兼具效率与性能的轻量化网络,可以在大规模的神经网络设计中减轻人工设计和调试的负担。
-
公开(公告)号:CN116612445B
公开(公告)日:2023-10-31
申请号:CN202310891062.5
申请日:2023-07-20
Applicant: 华侨大学
IPC: G06V20/54 , G06V10/762 , G06V10/74 , G06V10/764 , G06V10/774 , G06V10/778 , G06V10/82 , G06N3/088
Abstract: 本发明公开了一种基于自适应聚类和困难样本加权的无监督车辆再辨识方法,首先,利用当前聚类参数计算最合适的半径值,提升聚类伪标签对车辆样本噪声的鲁棒性;其次,记忆模块记录所有车辆样本特征向量,利用距离作为车辆样本困难程度加权依据,改善模型对困难车辆样本关注力不足的问题;最后,利用加权困难车辆样本结合对比学习方法训练车辆再辨识模型。本发明可广泛应用于智慧交通和智慧安防中的智能视频监控系统。
-
公开(公告)号:CN119741304B
公开(公告)日:2025-05-06
申请号:CN202510262624.9
申请日:2025-03-06
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
Abstract: 本发明公开了一种基于三维人脸几何结构的无参考质量评估方法及装置,涉及计算机视觉领域,方法包括:三维人脸网格模型重建;计算映射关键点和提取关键点之间的欧几里得距离,获得几何一致性分数;用三维人脸分割算法划分人脸区域,计算高斯曲率得到区域曲率分数;计算模型表面的平滑度,检测模型表面是否存在不自然的突起或瑕疵,获得平滑度分数;将几何一致性分数、区域曲率分数和平滑度分数按照加权比例进行融合,输出三维人脸网格模型的综合质量分数。本发明无需依赖数据库中的标准人脸模型,能够基于人脸几何特征和区域性分析对单个重建的三维人脸网格模型质量进行全面评估,适用于智能美容、精准医疗等个性化重建场景。
-
-
-
-
-
-
-
-
-