-
公开(公告)号:CN115222998B
公开(公告)日:2023-01-03
申请号:CN202211120458.1
申请日:2022-09-15
Applicant: 杭州电子科技大学 , 浙江大华技术股份有限公司
Inventor: 颜成钢 , 殷俊 , 颜拥 , 王洪波 , 胡冀 , 熊剑平 , 李亮 , 郑博仑 , 林聚财 , 孔书晗 , 王亚运 , 孙垚棋 , 金恒 , 朱尊杰 , 高宇涵 , 殷海兵 , 王鸿奎 , 陈楚翘 , 刘一秀 , 李文超 , 王廷宇 , 张勇东 , 张继勇
IPC: G06V10/764 , G06V10/30 , G06V10/40 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种图像分类方法。首先构建通道维度注意力网络和空间维度多尺度自注意力网络;然后将输入图像预处理后输入通道维度注意力网络,生成基于通道维度的注意力特征图;将基于通道维度的注意力特征图输入至空间维度的多尺度自注意力网络,生成基于特征图空间维度的多尺度自注意力特征图;最后将最终生成的多维度多尺度注意力特征图输入到分类器单元中,将模型输出的向量转换成概率表示,完成图像分类。本发明设计了一种新的多尺度自注意力机制,它利用一系列的深度可分离卷积操作,生成特征信息高度相关的局部特征图和区域特征图,不但可以强化自注意力机制的细粒度特征提取能力,还可以高效的提取有效的全局信息。