掩模与语义协同优化扩散模型的石材表面瑕疵检测方法

    公开(公告)号:CN119477922B

    公开(公告)日:2025-04-22

    申请号:CN202510067481.6

    申请日:2025-01-16

    Applicant: 华侨大学

    Abstract: 本发明提供掩模与语义协同优化扩散模型的石材表面瑕疵检测方法,属于瑕疵检测领域,包括:获取数据集;将输入图片输入编码器以得到输入表征,对输入表征进行高斯噪声向前扩散得到全噪声表征;将各输入表征与掩模图片点乘后输入掩模引导的知识提炼网络以生成掩模表征;将输入表征输入含多维特征金字塔的语义引导增强网络以得到语义表征;将全噪声表征、掩膜表征和语义表征进行拼接后,进行反向扩散以逐步去除噪声,并解码生成重建图片;将输入图片及其对应的重建图片均输入特征提取网络,进而计算得到异常得分;根据异常得分进行排序并形成异常得分列表,将异常得分列表对应的输入图片的热力图反馈至用户。本发明能够有效提升对瑕疵的检测精度。

    一种基于语义偏好挖掘的行人再辨识方法

    公开(公告)号:CN118196840A

    公开(公告)日:2024-06-14

    申请号:CN202410610290.5

    申请日:2024-05-16

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于语义偏好挖掘的行人再辨识方法,涉及人工智能、机器视觉领域,包括:利用预训练的语义分割模型将行人图像处理为语义分割图,将语义分割图空间划分为若干部件语义块,计算不同语义在语义分割图与部件语义块中的比例,根据不同语义的比例对部件语义块分组进行语义对齐,获得各部件语义块分组对应的部件序号;基于部件序号对部件特征分组,利用自注意网络将各部件特征组投影到公共嵌入空间并进行偏好挖掘,继而利用偏好信息对各部件特征组进行自适应聚合,增强行人再辨识准确性。

    面向大范围车辆再辨识的不完备模态特征融合方法

    公开(公告)号:CN117315430A

    公开(公告)日:2023-12-29

    申请号:CN202311595144.1

    申请日:2023-11-28

    Applicant: 华侨大学

    Abstract: 本发明一种面向大范围车辆再辨识的不完备模态特征融合方法,涉及图像处理技术领域,包括:训练包括三通道模型和单通道模型的双模态模型,对可见光车辆图像,采用三通道模型提取主特征,辅以图像灰度化,采用单通道模型提取辅助特征;对红外光车辆图像,采用单通道模型提取主特征,辅以通道复制扩展,采用三通道模型提取辅助特征;将主特征和辅特征叠加获得完整特征,利用KL散度优化完整、主、辅特征三者之间后验概率分布差异,优化特征融合效果。本发明能解决在长时间大范围的监控场景中车辆因活动轨迹复杂多变出现的模态不完备问题,即可见光和红外车辆图像不完备而无法直接实现可见光和红外图像的特征融合问题,提升车辆再辨识准确性。

    一种基于结构相似度的非局部注意力学习方法

    公开(公告)号:CN114972812A

    公开(公告)日:2022-08-30

    申请号:CN202210624115.2

    申请日:2022-06-02

    Abstract: 本发明提供一种基于结构相似度的非局部注意力学习方法,可广泛应用于机器视觉领域,例如图像分割、图像分类、图像识别等。现有非局部注意力方法简单计算不同空域位置的两个信号内积作为二者的相似度度量,并不完全符合人类视觉感知特点。针对这一问题,本发明提出利用结构相似度衡量不同空域位置的信号之间的相似度,在非局部注意力学习方法中充分考虑人类视觉对信号感知三个重要因素,即亮度、对比度和结构。其次,本发明进一步提出多尺度结构相似度度量策略,在不同尺度上更为全面地进行信号相似度度量。因此,本发明能够取得比现有非局部注意力方法更好地注意力学习效果。

    一种基于混沌映射和混沌S盒代换的图像加密方法

    公开(公告)号:CN112906043A

    公开(公告)日:2021-06-04

    申请号:CN202110372256.5

    申请日:2021-04-07

    Applicant: 华侨大学

    Abstract: 本发明提供了图像加密技术领域的一种基于混沌映射和混沌S盒代换的图像加密方法,包括:步骤S10、获取彩色图像文件并进行哈希计算得到哈希值,基于哈希值计算系统参数;步骤S20、基于哈希值生成四维超混沌映射的四个初始值,进而得到四组混沌伪随机序列;步骤S30、基于混沌伪随机序列以及系统参数提取序列Wz,利用序列Wz以及使用AES算法的S盒生成混沌S盒;步骤S40、对彩色图像文件进行Arno l d置乱得到置乱图像,利用混沌S盒对置乱图像进行字节代换得到代换图像;步骤S50、利用混沌伪随机序列以及系统参数,对代换图像中RGB的三个分量进行图像扩散加密得到三个密文数据,基于各密文数据得到加密图像。本发明的优点在于:极大的提升了图像加密的安全性。

    联合决策树和模糊推理的网络视频质量评估方法及系统

    公开(公告)号:CN112235566A

    公开(公告)日:2021-01-15

    申请号:CN202011072784.0

    申请日:2020-10-09

    Applicant: 华侨大学

    Abstract: 本发明提供一种联合决策树和模糊推理的网络视频质量评估方法及系统,所述方法包括:步骤S10、获取视频质量的影响因素;步骤S20、构建决策树模型,并根据评估值的分类,构建评估值与决策树模型的叶子节点之间的映射关系,得到不同类别的叶子节点;步骤S30、根据叶子节点的类别选择对应的推理规则,将影响因素分为应用指标和图像指标两组,并分别以应用指标和图像指标作为输入进行模糊推理,得到应用指标推理结果和图像指标推理结果,计算应用指标推理结果和图像指标推理结果的加权平均值,即为视频质量的客观评估值。本发明联合了决策树和模糊推理算法,减少模糊推理处理次数,同时兼顾了视频评估准确性与效率。

    基于机器视觉的石材版面智能仓储管理方法及系统

    公开(公告)号:CN119648117A

    公开(公告)日:2025-03-18

    申请号:CN202510169101.X

    申请日:2025-02-17

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于机器视觉的石材版面智能仓储管理方法及系统,涉及图像处理技术领域,方法包括:通过机器视觉检测石材版面的瑕疵并计算异常得分,进行异常排序与评级,获得每个石材版面的瑕疵评级;将RGB图像归一化为正则RGB,并进行伽玛矫正线性化转换至CIELAB颜色空间,计算石材版面的均色LAB;基于瑕疵评级和均色LAB信息录入RFID标签,并据此分类入库;接收用户对石材版面数量、瑕疵评级和均色的要求,筛选出最相似的石材版面反馈给用户;用户可选择接受或拒绝,若拒绝则重新筛选。本申请通过机器视觉检测石材版面的瑕疵和色差,结合RFID标签实现自动化入库、分类管理和精准出库,提高了仓储效率和管理精度。

    基于多尺度注意力相似化蒸馏的无人机检测方法及装置

    公开(公告)号:CN117315516A

    公开(公告)日:2023-12-29

    申请号:CN202311616489.0

    申请日:2023-11-30

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于多尺度注意力相似化蒸馏的无人机检测方法及装置,涉及目标检测领域,包括:构建多尺度注意力图生成模块、教师网络及待训练的学生网络,通过多尺度注意力图生成模块分别将教师网络和学生网络的中间层特征映射转换为教师空间注意力信息和学生空间注意力信息,并建立注意力信息相似度优化损失函数,将注意力信息相似度优化损失函数与全局性的后验概率蒸馏函数以及学生网络的无人机目标分类损失函数和目标框回归损失函数结合以建立总损失函数,基于总损失函数对待训练的学生网络进行训练,得到经训练的学生网络;将图像输入经训练的学生网络,得到无人机检测结果,解决现有技术无人机检测准确率低、实时性差的问题。

    一种基于Transformer与卷积交互的轻量级图像超分辨率方法

    公开(公告)号:CN116596764B

    公开(公告)日:2023-10-31

    申请号:CN202310871402.8

    申请日:2023-07-17

    Applicant: 华侨大学

    Abstract: 本发明涉及图像处理技术领域,公开了一种基于Transformer与卷积交互的轻量级图像超分辨率方法,包括以下步骤:S1,构建跨通道Transformer模块与高效局部特征提取模块;S2,构建反转U型网络模块;S3,构建全局特征提炼模块;S4,将反转U型网络模块与全局特征提炼模块组合起来,构建基于Transformer与卷积交互的轻量级超分辨率网络;网络输入低分辨率图像,输出高分辨率的重建图像。本发明使用较少参数与计算量,同时拥有更优的重建效果;通过Transformer与卷积的交互,兼顾图像的全局与局部细节;反转U型网络模块先在编码器阶段将关键信息转移至特征图维度上,再在解码器阶段将关键信息返回至通道维度中,以实现低资源耗费来融合多阶段信息的目的。

Patent Agency Ranking