一种基于注意力的细粒度图像识别方法

    公开(公告)号:CN116580289A

    公开(公告)日:2023-08-11

    申请号:CN202310678774.9

    申请日:2023-06-08

    Inventor: 李兰英 林成承

    Abstract: 一种基于注意力的细粒度图像识别方法,属于图像分类技术领域,该方法通过空间深度模块、多尺度特征提取模块、上下文注意力感知模块和多头注意力模块来构建网络模型。通过空间深度模块加强模型的特征提取能力,减少因下采样导致的判别区域丢失;通过多尺度特征提取模块基于显著区域提取多尺度特征,以增强模型的识别准确率;通过上下文注意力感知模块学习各尺度特征间的局部联系;通过多头注意力模块学习多尺度特征的全局和长期联系;最后采用交叉熵损失函数和中心损失函数作为该网络的损失函数,通过扩大样本间的类间距离,缩小类内距离,以减少易混淆区域对模型识别精度的影响。该方法可以很好地解决细粒度图像识别中存在的由于网络层数的加深导致低层次信息丢失,以及忽略多尺度特征间的关系导致识别准确率低的问题。

Patent Agency Ranking