基于提示词学习的图像分类方法、装置、设备及介质

    公开(公告)号:CN118397350A

    公开(公告)日:2024-07-26

    申请号:CN202410511838.0

    申请日:2024-04-26

    Abstract: 本发明提供一种基于提示词学习的图像分类方法、装置、设备及介质。该方法包括:获取待分类图像、预设的多个标签和每个标签对应的多个初始提示词;分别将每个标签和对应的多个初始提示词输入至预设分类模型的文本编码器中,得到文本编码器输出的每个标签对应的第一文本向量;利用预设通道因子,对每个标签对应的第一文本向量进行调整,获得每个标签对应的第二文本向量;根据待分类图像对应的第一图像向量,以及每个标签对应的第二文本向量,确定待分类图像与每个标签的相似度;基于待分类图像与每个标签的相似度,对待分类图像进行分类。本发明能够实现快速准确地进行图像分类。

Patent Agency Ranking