-
公开(公告)号:CN120032371A
公开(公告)日:2025-05-23
申请号:CN202510109507.9
申请日:2025-01-23
Applicant: 厦门大学
IPC: G06V20/70 , G06V10/26 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/82 , G06F40/30 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了一种面向高效的开放词汇全景分割方法,包括以下步骤:S1、基于多尺度特征提取器和轻量级聚合器进行视觉特征提取和聚合;S2、利用文本编码器对任意类别词汇进行编码,得到文本嵌入 S3、基于词汇感知选择模块提升视觉聚合特征的语义理解,减轻掩码解码器的特征交互负担;S4、基于双向动态嵌入专家,通过动态分配专家权重,生成具有语义感知和空间感知的实例嵌入;S5、基于轻量级解码器,使用对象核逐层进行掩码预测和细化,利用对象核和文本嵌入进行点积作为类别预测;该方法在实现相当性能的同时,旨在减少模型计算开销、加快推理速度,具有显著的实用价值和应用前景。
-
公开(公告)号:CN119810442A
公开(公告)日:2025-04-11
申请号:CN202411868829.3
申请日:2024-12-18
Applicant: 厦门大学
IPC: G06V10/26 , G06V10/25 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0895 , G06N3/096
Abstract: 本发明公开了一种伪标签质量解耦与修正的半监督实例分割方法及系统,方法包括以下步骤:教师模型处理未标注图像并生成预测结果;通过解耦的双阈值机制过滤预测结果,保留满足条件的预测结果作为实例伪标签;对实例伪标签进行动态实例类别修正,得到修正伪标签;结合预测结果和修正伪标签构建损失函数,训练用于进行实例分割的学生模型。本发明通过解耦的双阈值过滤机制、动态实例类别修正模块及像素级掩码不确定性感知机制,独立控制伪标签的类别与掩码质量,有效减少半监督实例分割任务中伪标签噪声带来的影响;本发明尤其适用于需要利用大规模未标注数据提升图像理解方面的有效性的半监督场景,其显著提升了半监督实例分割的性能。
-
公开(公告)号:CN120014272A
公开(公告)日:2025-05-16
申请号:CN202510093896.0
申请日:2025-01-21
Applicant: 厦门大学
IPC: G06V10/26 , G06V20/70 , G06V10/44 , G06V10/82 , G06N3/0464
Abstract: 本发明公开了一种基于语义一致性和风格多样性的域泛化语义分割方法,包括以下步骤:S1、基于CLIP视觉编码器和文本编码器进行视觉和文本特征提取;S2、基于语义查询增强器利用图文模态间的语义一致性,建立跨模态语义关联并聚合相关语义特征以增强初始对象查询;S3、基于文本驱动的风格变换模块利用文本嵌入差异,引导图像特征低频幅度谱的变换;S4、通过协同加权风格对比损失和风格聚合损失,加强领域间特征的分离和领域内特征的聚合;S5、基于掩码解码器使用语义查询逐层进行掩码预测、类别预测和查询细化;该方法在各个跨域数据集上实现了显著优于现有方法的最佳性能,同时保持模型的训练开销低、推理速度快,具有显著的实用价值和应用前景。
-
公开(公告)号:CN119762908A
公开(公告)日:2025-04-04
申请号:CN202411811506.0
申请日:2024-12-10
Applicant: 厦门大学
IPC: G06V10/774 , G06V10/764 , G06V10/772 , G06V10/776 , G06V10/82
Abstract: 本发明公开了一种高质量工业异常数据合成方法,包括以下步骤:S1、采用混合异常解耦模块,通过视觉语言模型进行多轮对话,对异常数据集中耦合的异常类别进行解耦,使耦合的异常类别转化为更细粒度的类别和属性;S2、采用高质量异常掩码生成模块,通过异常掩码生成器、引导区域Printer和异常掩码定位器,生成与各种属性对齐的、位置精确且形状正常的异常掩码;S3、采用自动异常数据集生成模块,通过Textual Inversion方法和自动过滤器,合成并筛选出了高质量的异常图像与掩码对;该方法通过混合异常解耦模块、高质量异常掩码生成模块和自动异常数据集生成模块实现高质量异常图像和掩码对的合成。
-
-
-