-
公开(公告)号:CN117612056A
公开(公告)日:2024-02-27
申请号:CN202311407926.8
申请日:2023-10-27
Applicant: 华南农业大学
Abstract: 本发明公开了一种基于语义理解与自身感知的视频目标分割方法及装置,方法包括:采用预设的编码器提取视频当前帧的图像,获取浅层特征与深层特征;对深层特征与特征记忆建立密集匹配关系,然后使用自感知关系增强特征,经过特征融合后获取融合的特征匹配结果;对深层特征经过密集匹配后形成语义关系,获取深层语义输出序列;使用语义解码器对浅层特征和深层语义输出序列进行融合并解码,获取多尺度语义特征;最后将融合的特征匹配结果、多尺度语义特征和浅层特征输入到分割解码器,获取分割结果。本发明提升复杂场景特别是外观变化较大场景下的目标分割表现,同时能够真实地还原出目标的边缘细节,提升分割掩码边界的精确度。
-
公开(公告)号:CN119516249A
公开(公告)日:2025-02-25
申请号:CN202411464089.7
申请日:2024-10-21
Applicant: 华南农业大学
IPC: G06V10/764 , G06V10/82 , G06N3/0455 , G06V10/774 , G06V10/776 , G06V10/40 , G06V10/30 , G06V10/75 , G06T7/00
Abstract: 本发明公开了一种基于变分自编码器与去噪网络的多类别缺陷检测方法及装置,方法包括:获取工业产品表面缺陷图像并进行预处理,构建训练集和验证集;方法的训练过程分为两个阶段:第一阶段,将预处理后的训练图像输入变分自编码器进行训练,学习图像的特征分布,并通过重建图像来捕捉正常图像的特征。第二阶段,利用去噪网络与特征引导模块在变分自编码器的特征空间中对图像特征进行二次重建,从而增强模型的重建能力和多类别重建能力;在推理阶段,通过特征提取器提取原始图像与重建图像的多尺度特征,进行特征比对,生成异常评分图。本发明在增强变分自编码器重建能力的同时保留正常信息,有效减少重建失败而导致的缺陷漏检。
-
公开(公告)号:CN117593519A
公开(公告)日:2024-02-23
申请号:CN202311372654.2
申请日:2023-10-23
Applicant: 华南农业大学
IPC: G06V10/26 , G06V10/762 , G06F17/16 , G06F17/18
Abstract: 本发明公开了一种基于改进的熵正则化模糊K‑means的图像分割方法及装置。方法包括:首先,对原始图像进行预处理;接着,利用k×1个中间变量构造熵正则化模糊K‑means算法的等效目标函数;然后,通过一个简单的交替迭代算法求解变量;然后,通过一个简单且高效的迭代重加权方法优化变量求解,并得到最终的隶属矩阵。最后,将每个像素聚类到隶属度最高的集群中,得到分割结果,实现图像的分割。本发明方法不仅可以降低熵正则化模糊K‑means算法的空间复杂度,还解决了熵正则化模糊K‑means算法容易收敛到较差的局部最小值缺陷,同时也提高了分割精度。
-
-