-
公开(公告)号:CN119477922B
公开(公告)日:2025-04-22
申请号:CN202510067481.6
申请日:2025-01-16
Applicant: 华侨大学
IPC: G06T7/00 , G06N3/0464 , G06N3/084 , G06N3/096 , G06V10/44 , G06V10/774 , G06V10/80 , G06V10/82
Abstract: 本发明提供掩模与语义协同优化扩散模型的石材表面瑕疵检测方法,属于瑕疵检测领域,包括:获取数据集;将输入图片输入编码器以得到输入表征,对输入表征进行高斯噪声向前扩散得到全噪声表征;将各输入表征与掩模图片点乘后输入掩模引导的知识提炼网络以生成掩模表征;将输入表征输入含多维特征金字塔的语义引导增强网络以得到语义表征;将全噪声表征、掩膜表征和语义表征进行拼接后,进行反向扩散以逐步去除噪声,并解码生成重建图片;将输入图片及其对应的重建图片均输入特征提取网络,进而计算得到异常得分;根据异常得分进行排序并形成异常得分列表,将异常得分列表对应的输入图片的热力图反馈至用户。本发明能够有效提升对瑕疵的检测精度。
-
公开(公告)号:CN119850441A
公开(公告)日:2025-04-18
申请号:CN202510317059.1
申请日:2025-03-18
Applicant: 华侨大学 , 信泰(福建)科技有限公司 , 福建省万物智联科技有限公司
Abstract: 本发明公开了一种基于频域边界协同优化的沉浸式视频增强方法及装置,涉及视频处理领域,包括:获取待重建的压缩的多视点纹理加深度视频序列并输入到经训练的沉浸式视频增强模型;当前的待增强视频帧先经过特征提取模块,分别提取得到高频特征和低频特征;高频特征和低频特征经过频域增强模块,得到频域增强图像;频域增强图像和当前的待增强视频帧输入到边界增强模块,得到融合图像;融合图像和当前的待增强视频帧的相邻视频帧输入到时空可变形卷积模块,得到对齐后的融合图像,对齐后的融合图像经过质量增强模块,预测得到增强残差并生成对应的重建视频。本发明解决压缩伪影、边界伪影以及沉浸式视频的质量低等问题。
-
公开(公告)号:CN119599875B
公开(公告)日:2025-04-11
申请号:CN202510138336.2
申请日:2025-02-08
Applicant: 华侨大学
IPC: G06T3/4053 , G06N3/0455 , G06N3/08 , G06T3/4038 , G06T3/4046 , G06T5/60 , G06T5/73
Abstract: 本发明公开了一种面向局部运动模糊的图像超分辨率方法及装置,涉及图像处理领域,包括:获取待重建的低分辨率图像并输入到经训练的图像超分辨率模型,低分辨率图像输入到图像选择模块,得到图像分组标签,图像分组标签包括正标签和负标签,正标签与模糊图像块相对应,负标签与其他图像块相对应;根据图像分组标签分别将正标签相对应的模糊图像块以及负标签相对应的其他图像块输入到正标签特征提取分支和负标签特征提取分支,得到正标签特征和负标签特征,正标签特征和负标签特征经过拼接层进行拼接,得到图像特征;图像特征经过图像重建模块,重建得到对应的高分辨率图像。本发明解决了局部运动模糊图像在超分辨率重建中性能差和效率低的问题。
-
公开(公告)号:CN119762721A
公开(公告)日:2025-04-04
申请号:CN202510261796.4
申请日:2025-03-06
Applicant: 华侨大学 , 信泰(福建)科技有限公司 , 福建省万物智联科技有限公司
IPC: G06T19/20 , G06T9/00 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于语义与几何引导的多阶段Mamba点云补全方法及装置,涉及点云处理领域,包括:构建基于语义与几何引导的多阶段Mamba点云补全模型并训练,得到经训练的多阶段Mamba点云补全模型;多排序策略Mamba解码器单元包括依次连接的若干个阶段的多排序策略Mamba解码器;获取待补全的不完整点云并输入到经训练的多阶段Mamba点云补全模型,不完整点云经过Transformer‑Mamba联合的点云局部特征编码单元,得到编码特征,编码特征输入到稀疏点云生成单元中,得到稀疏点云;稀疏点云输入到多排序策略Mamba解码器单元中,得到解码特征,解码特征经过点云上采样单元,得到预测的完整点云,克服现有Transformer编码器‑解码器结构二次方复杂度和局部细节丢失的问题。
-
公开(公告)号:CN119478751B
公开(公告)日:2025-03-25
申请号:CN202510062002.1
申请日:2025-01-15
IPC: G06V20/30 , G06V40/70 , G06V40/10 , G06V40/16 , G06V10/44 , G06V10/74 , G06V10/762 , G06V10/774 , G06V10/80 , G06F16/583 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于渐进式多源特征融合与对齐的人像聚档方法及装置,涉及公共视频智能分析领域,包括:构建人像聚档模型,在人像聚档模型中,对人脸图像、人脸模拟素描画像、人体图像、人体模拟素描画像的特征进行渐进融合,并通过伪标签聚类和相似度约束对齐人体特征与人脸特征,有效融合多源人像特征,生成渐进多源融合的行人特征;将待查询人员的人脸图像、人体图像及其相对应的人脸模拟素描画像、人体模拟素描画像输入到经训练的人像聚档模型,得到待查询人员的渐进多源融合的行人特征,并计算其与数据库中每个参考样本的渐进多源融合的行人特征的相似度,以进行人像聚档。
-
公开(公告)号:CN119180753B
公开(公告)日:2025-03-14
申请号:CN202411681831.X
申请日:2024-11-22
Applicant: 华侨大学
IPC: G06T3/4053 , G06N3/045 , G06N3/0464 , G06T3/4046
Abstract: 本发明涉及图像超分辨率技术领域,公开了一种特征强化的跨窗口轻量级超分辨率方法、系统及电子设备,方法包括以下步骤:构建基于Token字典交叉的自注意力机制,并引入Token分组机制,组成基于Token分组的字典交叉自注意力模块,即TDAB模块;基于TDAB模块构建特征强化的跨窗口轻量级超分辨率网络;使用所述特征强化的跨窗口轻量级超分辨率网络对待重建的低分辨率图像进行重建,得到重建结果。本方法在经典超分辨率方法的基础上引入基于Token字典交叉的自注意力机制、基于Token分组的混合注意力模块,在使模型更轻量化的同时增强了模型对于跨越窗口依赖的捕获能力以及对于纹理细节特征的重建效果。
-
公开(公告)号:CN119599875A
公开(公告)日:2025-03-11
申请号:CN202510138336.2
申请日:2025-02-08
Applicant: 华侨大学
IPC: G06T3/4053 , G06N3/0455 , G06N3/08 , G06T3/4038 , G06T3/4046 , G06T5/60 , G06T5/73
Abstract: 本发明公开了一种面向局部运动模糊的图像超分辨率方法及装置,涉及图像处理领域,包括:获取待重建的低分辨率图像并输入到经训练的图像超分辨率模型,低分辨率图像输入到图像选择模块,得到图像分组标签,图像分组标签包括正标签和负标签,正标签与模糊图像块相对应,负标签与其他图像块相对应;根据图像分组标签分别将正标签相对应的模糊图像块以及负标签相对应的其他图像块输入到正标签特征提取分支和负标签特征提取分支,得到正标签特征和负标签特征,正标签特征和负标签特征经过拼接层进行拼接,得到图像特征;图像特征经过图像重建模块,重建得到对应的高分辨率图像。本发明解决了局部运动模糊图像在超分辨率重建中性能差和效率低的问题。
-
公开(公告)号:CN119180752B
公开(公告)日:2025-02-25
申请号:CN202411678685.5
申请日:2024-11-22
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
IPC: G06T3/4053 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06T3/4046
Abstract: 本发明公开了一种基于高效频域Transformer的轻量级图像超分辨率方法及装置,涉及图像处理领域,包括:构建基于高效频域Transformer的图像超分辨率模型并训练,得到经训练的图像超分辨率模型,图像超分辨率模型包括第一卷积层、亚像素卷积层、第二卷积层以及若干个高效频域Transformer模块;获取待重建的低分配率图像和上采样因子并输入经训练的图像超分辨率模型,先经过第一卷积层,得到第一卷积层的输出特征,第一卷积层的输出特征依次经过若干个高效频域Transformer模块,将最后一个高效频域Transformer模块的输出特征与第一卷积层的输出特征相加,得到第二相加结果,第二相加结果依次经过亚像素卷积层和第二卷积层,得到高分辨率重建图像。本发明克服现有Transformer方法计算复杂度过高的问题。
-
公开(公告)号:CN119068266B
公开(公告)日:2025-02-14
申请号:CN202411551042.4
申请日:2024-11-01
Applicant: 华侨大学 , 泉州圣源警用侦察设备有限公司
IPC: G06V10/764 , G06V10/74 , G06V10/774 , G06V10/82 , G06V20/52 , G06F17/16
Abstract: 本发明涉及图像处理与目标识别技术领域,公开了一种基于真伪标签一致性的跨模态行人再辨识方法及系统,方法包括:通过深度神经网络对可见光与红外光两种不同模态的行人图像提取特征向量;计算同模态、不同模态间的特征向量相似度,构建同模态、跨模态匹配矩阵,并进行归一化处理,生成同模态和跨模态归一化匹配矩阵;采用跨模态归一化匹配矩阵和同模态归一化匹配矩阵对真实标签进行投影,获得跨模态伪标签;优化真实标签与跨模态伪标签之间的Kullback‑Leibler(KL)散度,从而优化同模态和跨模态匹配矩阵,提升匹配矩阵对模态变化的鲁棒性,从而提升跨模态行人再辨识准确性。
-
公开(公告)号:CN119323805A
公开(公告)日:2025-01-17
申请号:CN202411876774.0
申请日:2024-12-19
Applicant: 华侨大学
IPC: G06V40/10 , G06N3/0464 , G06N3/084 , G06V10/32 , G06V40/20
Abstract: 本发明公开了一种动静正则混合采样的行人再辨识方法及系统,涉及公共安全智能视频监控技术领域。实践中,采样常独立于行人再辨识模型训练,导致训练过程采样的信息丢失不受控制,制约识辨准确性。为此,本发明设计了正则动态线性采样和静态线性采样混和方法,实现行人再辨识模型训练过程中联合优化采样效果,其中,前者通过归一化的可学习参数,以数据驱动的动态方式学得动态的像素组合权重;后者利用双线性变换来确定静态的像素组合权重,实现与数据无关的采样策略。本发明进一步设计了动静正则项,约束动态的像素组合权重与静态的像素组合权重之间的差异,控制可学习参数的自由度,更好地组合动静采样,减少传统单一静态采样过程中信息损失。
-
-
-
-
-
-
-
-
-