一种基于提示引导的零样本图像分类方法及系统

    公开(公告)号:CN118691898A

    公开(公告)日:2024-09-24

    申请号:CN202410853614.8

    申请日:2024-06-28

    Abstract: 本发明涉及一种基于提示引导的零样本图像分类方法及系统,涉及计算机视觉人工智能技术领域。方法包括:根据全局语义表示、实例提示表示和实例视觉表示计算得到增强视觉表示、所有类别的属性的相似度分数、分类模型优化的总损失,将所述总损失作为优化目标,优化分类模型的参数;根据优化后的分类模型计算所给图像与不可见类别的属性之间的相似度分数,输出图像对应的预测标签,实现零样本图像的分类。本方法能够在没有可训练的图像样本的场景下,充分利用文本语义提示和属性向量进行自动图像分类,保证了实例级语义信息和实例级视觉信息可靠的跨模态交流,提高了图像分类的精度。

Patent Agency Ranking