-
公开(公告)号:CN118381920A
公开(公告)日:2024-07-23
申请号:CN202410807401.1
申请日:2024-06-21
Applicant: 华侨大学
IPC: H04N19/147 , G06V10/80 , G06V10/44 , G06V10/54
Abstract: 本发明公开了一种基于联合特征的MIV沉浸式视频率失真优化方法,涉及视频编码领域,包括:计算像素的几何失真权重;将帧内划分为纹理区域与深度区域,提取纹理区域的纹理复杂度特征、纹理区域的边缘特征和深度区域的边缘特征,自适应融合纹理区域的边缘特征和深度区域的边缘特征以得到融合边缘特征;使用纹理复杂度特征与融合边缘特征组成的联合特征,计算得到纹理区域的失真度量缩放因子与深度区域的失真度量缩放因子;根据纹理区域的失真度量缩放因子、失真度量缩放因子和几何失真权重计算新拉格朗日乘子;基于新拉格朗日乘子实现沉浸式视频的率失真优化。本发明可以使得最终渲染的沉浸式视频具有更好的渲染质量与率失真性能。
-
公开(公告)号:CN118379777A
公开(公告)日:2024-07-23
申请号:CN202410807403.0
申请日:2024-06-21
Applicant: 华侨大学
IPC: G06V40/16 , G06N3/0442 , G06N3/0475 , G06N3/094 , G06V10/774 , G06V10/82 , G06V20/40 , G06V40/20 , G10L21/10
Abstract: 本发明公开了一种基于姿势对抗网络的人脸视频生成方法及系统,涉及图像处理技术领域,方法包括:构建人脸视频生成模型,包括图像编码器、音频编码器、头部运动预测模块、姿势编码器和解码器,所述人脸视频生成模型接收人脸图像和语音音频,生成人脸说话视频;获取训练数据集并对人脸视频生成模型进行预训练;构建唇型同步判别器作为判别器,对预训练人脸视频生成模型进行生成对抗训练;利用训练好的人脸视频生成模型实现人脸视频生成。本发明利用音频信号的动态特性对头部运动进行建模,并结合生成对抗网络与唇型同步判别器提高人脸视频的唇形同步精度,同时兼顾视频的逼真度,使得其更加真实、自然,从而为各种应用场景提供了更多的灵活性。
-
公开(公告)号:CN118155731A
公开(公告)日:2024-06-07
申请号:CN202410311105.2
申请日:2024-03-19
Applicant: 华侨大学 , 厦门盈趣科技股份有限公司
IPC: G16B40/30 , G06F18/23 , G06N3/0455 , G06N3/08 , G06N7/02
Abstract: 本发明公开了一种基于宽度学习的多视图的癌症基因数据聚类集成方法及装置,包括:构建自编码器模型,确定经训练的子空间自表达结构的系数矩阵,基于该系数矩阵对自编码器模型进行训练,多视图的癌症基因数据输入经训练的自编码器模型,得到特征处理后的样本矩阵;对特征处理后的样本矩阵进行聚类,得到多个基础聚类结果并作为集成池中的集成成员,以构建模糊划分矩阵和置信度矩阵;构建基于第二宽度学习网络的聚类集成模型,对聚类集成模型进行训练,得到经训练的聚类集成模型,将模糊划分矩阵输入经训练的聚类集成模型,得到软集成结果,对软集成结果进行聚类,得到多视图的癌症基因数据的聚类结果,有效提升网络模型的鲁棒性和准确性。
-
公开(公告)号:CN117440158B
公开(公告)日:2024-04-12
申请号:CN202311759886.3
申请日:2023-12-20
Applicant: 华侨大学
IPC: H04N19/147 , H04N19/154
Abstract: 本发明公开了一种基于三维几何失真的MIV沉浸式视频编码率失真优化方法,涉及视频编码领域,包括:S1,基于MIV编码平台编码沉浸式视频序列,生成图集后,计算与深度映射范围系数;S2,使用支持MIV标准的二维视频编码器编码沉浸式视频几何图集时,构建三维几何失真与均方误差的关系模型;S3,根据三维几何失真与均方误差的关系模型,计算三维几何失真系数;S4,根据三维几何失真系数,计算率失真优化模型中新的拉格朗日乘子,基于调整后的率失真优化模型编码当前CTU,以改善沉浸式视频渲染质量的率失真性能。本发明最终渲染的沉浸式视频质量与码率的率失真性能更好。
-
公开(公告)号:CN117456480B
公开(公告)日:2024-03-29
申请号:CN202311769679.6
申请日:2023-12-21
Applicant: 华侨大学 , 星宸科技股份有限公司
IPC: G06V20/54 , G06V10/74 , G06V10/82 , G06N3/0464 , G06N3/09
Abstract: 本发明公开了一种基于多源信息融合的轻量化车辆再辨识方法,涉及计算机视觉与机器学习技术领域,包括:构建神经网络;所述神经网络包括依次连接的ResNet50网络、局部特征融合网络和混合注意力模块;使用监督对比损失和多源信息识别损失对神经网络进行联合训练,直至收敛,得到教师网络;选取计算量和参数量比教师网络均小的模型作为学生网络;通过知识蒸馏,对学生网络进行监督,训练直至收敛,得到轻量化的车辆再辨识模型;基于轻量化的车辆再辨识模型,输出再辨识结果。本发明利用多源信息融合的方式协调不同传感器数据以提高再辨识性能,并辅以知识蒸馏,实现在有限的计算资源下,实现高质量的再辨识,从而为各种应用场景提供了更多的灵活性。
-
公开(公告)号:CN117196960B
公开(公告)日:2024-03-01
申请号:CN202311475299.1
申请日:2023-11-08
Applicant: 华侨大学
IPC: G06T3/4053 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06V10/80
Abstract: 本发明公开了一种全尺度特征细化轻量级图像超分辨率方法及装置,涉及图像处理领域,该方法包括:构建全尺度特征细化轻量级图像超分辨率模型并训练,得到经训练的全尺度特征细化轻量级图像超分辨率模型,将低分辨率图像输入经训练的全尺度特征细化轻量级图像超分辨率模型,先经过第一卷积层得到第一特征图,第一特征图经过串联的K个特征蒸馏提取模块,每一个特征蒸馏提取模块的输出均传送至第二卷积层,并经过第三卷积层,得到第二特征图,第二特征图与第一特征图相加,得到最终特征图,最终特征图输入上采样模块,重建得到高分辨率图
-
公开(公告)号:CN117036911A
公开(公告)日:2023-11-10
申请号:CN202311301590.7
申请日:2023-10-10
Applicant: 华侨大学 , 星宸科技股份有限公司 , 厦门瑞为信息技术有限公司
IPC: G06V10/82 , G06N3/0464 , G06N3/08 , G06V10/74
Abstract: 本发明公开了一种基于神经架构搜索的车辆再辨识轻量化方法及系统,涉及计算机视觉与机器学习技术领域,方法包括:S1,构建网络模型,给定硬件约束以生成对应的架构生成器,利用测试集训练架构生成器;S2,将硬件约束输入到架构生成器,得到多个轻量化神经网络架构模型;S3,采集车辆再辨识数据并进行数据增强;S4,利用车辆再辨识数据集对轻量化神经网络架构模型进行训练及验证,选择效果最好的作为轻量化车辆再辨识网络;S5,基于轻量化车辆再辨识网络进行车辆再辨识。本发明利用神经架构搜索自适应地依据硬件约束进行神经网络的搭建,得到兼具效率与性能的轻量化网络,可以在大规模的神经网络设计中减轻人工设计和调试的负担。
-
公开(公告)号:CN116612445B
公开(公告)日:2023-10-31
申请号:CN202310891062.5
申请日:2023-07-20
Applicant: 华侨大学
IPC: G06V20/54 , G06V10/762 , G06V10/74 , G06V10/764 , G06V10/774 , G06V10/778 , G06V10/82 , G06N3/088
Abstract: 本发明公开了一种基于自适应聚类和困难样本加权的无监督车辆再辨识方法,首先,利用当前聚类参数计算最合适的半径值,提升聚类伪标签对车辆样本噪声的鲁棒性;其次,记忆模块记录所有车辆样本特征向量,利用距离作为车辆样本困难程度加权依据,改善模型对困难车辆样本关注力不足的问题;最后,利用加权困难车辆样本结合对比学习方法训练车辆再辨识模型。本发明可广泛应用于智慧交通和智慧安防中的智能视频监控系统。
-
公开(公告)号:CN120088349A
公开(公告)日:2025-06-03
申请号:CN202510562636.3
申请日:2025-04-30
Applicant: 华侨大学
IPC: G06T9/00 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于Vision‑Mamba CNN的端到端图像压缩方法及装置,涉及图像处理领域,包括:获取待压缩的图像并输入到经训练的图像压缩模型,先经过非线性变换网络,得到潜在表示并分别输入到第一量化器和超先验变换网络,得到量化后的潜在表示和超先验变换的潜在表示;超先验变换的潜在表示经过量化,并依次经过第二编码器、第二解码器和超先验反变换网络,得到超先验变换的第二潜在表示特征;量化后的潜在表示和超先验变换的第二潜在表示特征输入到上下文模块,得到高斯分布,量化后的潜在表示依次经过第一编码器和第一解码器并结合高斯分布,得到第一潜在表示特征并输入到非线性反变换网络,得到压缩后的图像,本发明解决了压缩效率与重建质量低的问题。
-
公开(公告)号:CN119863405A
公开(公告)日:2025-04-22
申请号:CN202510341442.0
申请日:2025-03-21
Applicant: 华侨大学
IPC: G06T5/77 , G06T5/60 , G06V10/42 , G06V10/44 , G06V10/80 , G06V10/82 , G06V20/40 , G06N3/0455 , G06N3/0464
Abstract: 本发明一种基于频域融合的大面积缺损视频修复方法及装置,涉及视频处理技术领域,针对现阶段缺损视频修复方法主要局限于小面积缺损场景,对大面积缺损的视频内容修复能力不足,难以生成合理的视觉修复结果的问题,提出了一种有效的解决方法,方法包括以下步骤:首先,获取缺损的视频帧序列,对视频帧序列进行下采样;接着,使用堆叠的频域融合残差块对下采样后的缺损视频帧进行全局信息建模,频域融合残差块由两个自适应频域交叉融合模块依次连接而成;然后,利用堆叠的时间Transformer模块优化多帧之间的时间一致性;最后,进行上采样以重建视频帧,得到最终修复的视频。本发明能够在大范围缺损区域中生成视觉上合理、内容流畅自然的视频修复效果。
-
-
-
-
-
-
-
-
-