-
公开(公告)号:CN117994589A
公开(公告)日:2024-05-07
申请号:CN202410269797.9
申请日:2024-03-11
Applicant: 东北大学
IPC: G06V10/764 , G06V10/82 , G06V10/774 , G06N3/0464 , G06N3/042
Abstract: 本发明属于图像分类技术领域,公开了一种基于注意力机制的零样本图学习细粒度图像分类方法。根据卷积神经网络对图像特征提取得到多通道特征图;通过通道分组层和加权层,从多通道特征图生成多个注意力区域,得到图像基于注意力的局部特征;基于已知类与未知类关系,建立图卷积神经网络;采用图卷积神经网络,结合图像基于注意力的局部特征,训练获得零样本学习任务中的未知类图像分类器;通过图卷积神经网络的损失函数与反向传播,结合图像基于注意力的局部特征,学习已知类图像分类器权重参数与未知类图像分类器权重参数,通过未知类图像分类器获得未知类图像分类结果。本方法提高图像分类准确性,具有稳定和简单的特点。
-
公开(公告)号:CN117935150A
公开(公告)日:2024-04-26
申请号:CN202410055251.3
申请日:2024-01-15
Applicant: 东北大学
IPC: G06V20/52 , G06V10/26 , G06V10/74 , G06V10/82 , G06N3/0455 , G06N3/0499 , G06N3/08
Abstract: 一种动态特征修剪与合并的遮挡行人重识别方法,属于计算机视觉领域。包括:获取遮挡行人重识别数据集与对应的标签构成原始数据集。对原始数据集预处理后的图片切割成块并添加额外的信息作为后续编码器的输入。利用稀疏编码器对测试库中的数据进行处理,利用普通编码器对测试搜索库中的数据进行处理。设计图片级与图片块级距离计算公式,得到测试搜索库中与测试库中遮挡图片最相近的多张未遮挡图片。利用Transformer解码器进行多张图片特征合并操作,将多张未遮挡图片中的特征合并到修剪后的遮挡图片中,以恢复遮挡图片被遮挡的查询特征。设计损失函数,输出遮挡图片识别结果。实验结果印证了模型识别遮挡图片的有效性。
-