-
公开(公告)号:CN118196731A
公开(公告)日:2024-06-14
申请号:CN202410605567.5
申请日:2024-05-16
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
Abstract: 本发明公开了一种基于通道与空间量子注意力学习的车辆再辨识方法及装置,涉及车辆再辨识领域,包括:利用深度网络从车辆图像中提取车辆的特征映射;设计通道量子注意力学习分支和空间量子注意力学习分支,分别对残差模块输出的特征映射学习通道量子注意力掩码和空间量子注意力掩码,并将两种注意力掩码融合为通道‑空间复合量子注意力掩码,用于增强车辆的特征映射,使深度网络能够更全面捕捉特征映射中的重要特征。本发明利用量子叠加与纠缠特性实现车辆注意力学习,能够提高特征学习效果,改善车辆再辨识的准确率,解决了传统机器学习模型难以学习这些复杂的非线性关系的问题。
-
公开(公告)号:CN119741304A
公开(公告)日:2025-04-01
申请号:CN202510262624.9
申请日:2025-03-06
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
Abstract: 本发明公开了一种基于三维人脸几何结构的无参考质量评估方法及装置,涉及计算机视觉领域,方法包括:三维人脸网格模型重建;计算映射关键点和提取关键点之间的欧几里得距离,获得几何一致性分数;用三维人脸分割算法划分人脸区域,计算高斯曲率得到区域曲率分数;计算模型表面的平滑度,检测模型表面是否存在不自然的突起或瑕疵,获得平滑度分数;将几何一致性分数、区域曲率分数和平滑度分数按照加权比例进行融合,输出三维人脸网格模型的综合质量分数。本发明无需依赖数据库中的标准人脸模型,能够基于人脸几何特征和区域性分析对单个重建的三维人脸网格模型质量进行全面评估,适用于智能美容、精准医疗等个性化重建场景。
-
公开(公告)号:CN118196731B
公开(公告)日:2024-08-16
申请号:CN202410605567.5
申请日:2024-05-16
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
Abstract: 本发明公开了一种基于通道与空间量子注意力学习的车辆再辨识方法及装置,涉及车辆再辨识领域,包括:利用深度网络从车辆图像中提取车辆的特征映射;设计通道量子注意力学习分支和空间量子注意力学习分支,分别对残差模块输出的特征映射学习通道量子注意力掩码和空间量子注意力掩码,并将两种注意力掩码融合为通道‑空间复合量子注意力掩码,用于增强车辆的特征映射,使深度网络能够更全面捕捉特征映射中的重要特征。本发明利用量子叠加与纠缠特性实现车辆注意力学习,能够提高特征学习效果,改善车辆再辨识的准确率,解决了传统机器学习模型难以学习这些复杂的非线性关系的问题。
-
公开(公告)号:CN118334711A
公开(公告)日:2024-07-12
申请号:CN202410757573.2
申请日:2024-06-13
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
IPC: G06V40/10 , G06N3/0455 , G06N3/0464 , G06T7/70 , G06V10/26 , G06V10/764 , G06V10/82
Abstract: 本发明公开了一种基于服装描述生成的行人性别与年龄识别方法及装置,涉及图像识别领域,包括:构建行人性别与年龄识别模型,通过线性映射层和前a层Transformer块将行人图像处理为识别特征和图像特征,利用人体部位检测模型获取行人图像中的人体部位的位置,并裁剪出各个人体部位图像,利用图像字幕生成模型生成各个人体部位图像对应的服装文字描述,并利用词嵌入模型将服装文字描述映射为服装文字描述向量,将服装文字描述向量输入特征提取模块,提取得到对应的向量特征,将所有向量特征拼接后再连接至识别特征和图像特征后,并依次经过后b层Transformer块、第一全连接层和Softmax函数层,得到识别结果,解决性别与年龄识别技术受观察角度与环境等因素影响较大的问题。
-
公开(公告)号:CN119444804A
公开(公告)日:2025-02-14
申请号:CN202510037837.1
申请日:2025-01-10
Applicant: 华侨大学
Abstract: 本发明涉及图像处理技术领域,提出了一种基于动态自适应和强化特征的多目标跟踪分割方法及系统,方法包括前处理步骤、外观代价计算步骤、预匹配步骤、运动代价计算步骤、正式匹配步骤、后处理步骤、重复步骤和可视化步骤。该方法通过具有动态自适应的数据关联对目标特征进行细化整合,以及利用基于掩码的注意力机制和基于四三角形变的掩码预测分别强化目标外观特征和运动信息,以能够在保持高跟踪精度的同时,实现快速运算和低成本运行,适用于更广泛的应用场景。
-
公开(公告)号:CN119027845B
公开(公告)日:2025-02-14
申请号:CN202411514321.3
申请日:2024-10-29
Applicant: 华侨大学 , 泉州圣源警用侦察设备有限公司
IPC: G06V20/17 , G06V10/25 , G06V10/764 , G06V10/77 , G06V10/774 , G06V10/80
Abstract: 本发明涉及图像处理与人工智能技术领域,公开了一种无人机森林火灾风险区块检测方法及系统,方法包括:构建基于区块分类的目标检测模型并进行训练,利用训练好的基于区块分类的目标检测模型实现无人机森林火灾风险区块检测;所述基于区块分类的目标检测模型利用区块映射器无人机图像中的不同区块映射为区块特征;利用多阶段采样网络对区块特征进行多种尺度的采样,并利用降维映射层进行尺度对齐,获得多尺度区块特征;通过哈达玛积融合多尺度区块特征,利用区块分类器将融合后的多尺度区块特征映射至区块类别概率。本发明以区域分类方式实现风险区块的定位,避免了现有技术因精确定位导致的庞大计算量,延长无人机可用时间。
-
公开(公告)号:CN118865075B
公开(公告)日:2024-12-03
申请号:CN202411319739.9
申请日:2024-09-23
Applicant: 华侨大学
IPC: G06V10/98 , G06N3/043 , G06N3/0464 , G06V10/776 , G06V10/82
Abstract: 本发明公开了一种基于分层时空感知的屏幕内容视频质量评价方法及装置,涉及视频评价领域,包括:提取屏幕内容视频中的若干个碎片化视频和若干个关键帧并输入经训练的屏幕内容视频质量评价模型,每个关键帧输入显著性计算模块筛选出若干个显著视频块,每个显著视频块输入双通道卷积神经网络,得到每个阶段的多层特征并输入块级质量评估模块,经过空间门特征增强模块,得到每个阶段的增强特征并输入块级质量聚合模块,得到每个视频块的块级质量分数;采用自适应加权策略计算得到空域感知质量分数;碎片化视频输入时域感知质量评估支路,得到时域感知质量分数,两者结合计算得到屏幕内容视频的质量分数,解决现有视频质量评价方法可靠性差的问题。
-
公开(公告)号:CN118379777B
公开(公告)日:2024-11-22
申请号:CN202410807403.0
申请日:2024-06-21
Applicant: 华侨大学
IPC: G06V40/16 , G06N3/0442 , G06N3/0475 , G06N3/094 , G06V10/774 , G06V10/82 , G06V20/40 , G06V40/20 , G10L21/10
Abstract: 本发明公开了一种基于姿势对抗网络的人脸视频生成方法及系统,涉及图像处理技术领域,方法包括:构建人脸视频生成模型,包括图像编码器、音频编码器、头部运动预测模块、姿势编码器和解码器,所述人脸视频生成模型接收人脸图像和语音音频,生成人脸说话视频;获取训练数据集并对人脸视频生成模型进行预训练;构建唇型同步判别器作为判别器,对预训练人脸视频生成模型进行生成对抗训练;利用训练好的人脸视频生成模型实现人脸视频生成。本发明利用音频信号的动态特性对头部运动进行建模,并结合生成对抗网络与唇型同步判别器提高人脸视频的唇形同步精度,同时兼顾视频的逼真度,使得其更加真实、自然,从而为各种应用场景提供了更多的灵活性。
-
公开(公告)号:CN118381920B
公开(公告)日:2024-09-17
申请号:CN202410807401.1
申请日:2024-06-21
Applicant: 华侨大学
IPC: H04N19/147 , G06V10/80 , G06V10/44 , G06V10/54
Abstract: 本发明公开了一种基于联合特征的MIV沉浸式视频率失真优化方法,涉及视频编码领域,包括:计算像素的几何失真权重;将帧内划分为纹理区域与深度区域,提取纹理区域的纹理复杂度特征、纹理区域的边缘特征和深度区域的边缘特征,自适应融合纹理区域的边缘特征和深度区域的边缘特征以得到融合边缘特征;使用纹理复杂度特征与融合边缘特征组成的联合特征,计算得到纹理区域的失真度量缩放因子与深度区域的失真度量缩放因子;根据纹理区域的失真度量缩放因子、失真度量缩放因子和几何失真权重计算新拉格朗日乘子;基于新拉格朗日乘子实现沉浸式视频的率失真优化。本发明可以使得最终渲染的沉浸式视频具有更好的渲染质量与率失真性能。
-
公开(公告)号:CN118469876A
公开(公告)日:2024-08-09
申请号:CN202410912771.1
申请日:2024-07-09
Applicant: 华侨大学
IPC: G06T5/77 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06T5/60
Abstract: 本发明公开了一种基于强感知Transformer架构的缺损视频修复方法及系统,涉及视频处理技术领域,方法包括以下步骤:特征提取模块接收待修复的缺损视频帧序列,采用卷积神经网络对视频帧进行特征提取,输出第一特征;强感知Transformer模块接收第一特征,采用交叉堆叠的局部感知Transformer和全局感知Transformer结构对第一特征进行纹理信息建模和结构信息建模,输出第二特征;重构模块接收第二特征,采用反卷积层进行视频帧重建,输出修复后视频帧序列。本发明采用交叉堆叠的局部感知Transformer和全局感知Transformer进行纹理信息和结构信息建模,有效解决现阶段缺损视频修复方法中存在修复区域缺乏细节纹理、全局结构与局部纹理不匹配的问题,实现更好的修复效果。
-
-
-
-
-
-
-
-
-