一种基于图像增强和模型轻量化的车辆重识别方法

    公开(公告)号:CN118172715A

    公开(公告)日:2024-06-11

    申请号:CN202410368267.X

    申请日:2024-03-28

    Applicant: 南昌大学

    Abstract: 本发明涉及车辆重识别领域,尤其涉及一种基于图像增强和模型轻量化的车辆重识别方法,包括如下步骤:S1,双频域的图像增强方法对昏暗场景下的样本进行图像增强处理;S2,修改后的ResNet50作为骨干网络以提取深层的语义信息;S3,多分支对称结构以准确地提取车辆的整体轮廓和局部细节,并且在分支网络中通过通道简化来减少特征的通道数量以减少网络的参数负担。本发明通过双频域的图像增强方法改善照度不足,轮廓模糊的车辆图片,缓解图像中存在的照度低或者对比度不足等问题;为了增加网络的实用性,设计了一个轻量化的多分支结构,通过削减分支中的特征通道以及使用小尺寸的卷积核降低网络负载,保证算法的性能。

    基于局部软注意力联合训练的无监督行人重识别方法

    公开(公告)号:CN117710898A

    公开(公告)日:2024-03-15

    申请号:CN202410018018.8

    申请日:2024-01-05

    Applicant: 南昌大学

    Abstract: 本发明公开了基于局部软注意力联合训练的无监督行人重识别方法,涉及行人重识别技术领域,将整个联合训练分为全局和局部两个分支,在局部分支中软注意力机制模块被提出来准确地捕捉局部区域的细微差异,进而提升Re‑ID模型对行人局部显著部位的鉴别能力,其次,双重交叉邻居标签平滑模块被设计来逐步缓解不同局部区域产生的不同程度的标签噪声,双重交叉邻居标签平滑模块模块通过全局与局部的相似性度量来实现行人全局与局部区域的语义对齐,随后通过邻近局部之间的交叉信息进一步建立局部区域之间的邻近关联性,进而实现整个训练过程中全局与局部区域的标签平滑,有效避免不同局部区域所包含的与身份无关信息会导致不同程度局部噪声的产生。

    一种跨模态食品检索方法
    4.
    发明公开

    公开(公告)号:CN119903203A

    公开(公告)日:2025-04-29

    申请号:CN202411890626.4

    申请日:2024-12-20

    Applicant: 南昌大学

    Abstract: 本发明涉及人工智能和机器学习的跨学科研究领域,尤其涉及。本发明提供了一种跨模态食品检索方法,重点是在图像编码器与食谱编码器的基础上增加多粒度交互编码器构建TE I框架,将给定的图像‑文本配对数据分别输入到图像编码器与食谱编码器进行训练学习,图像编码器提取全局视觉特征,食谱编码器提取层次化特征并使用线性层获得全局食谱特征,多粒度交互编码器提取多粒度特征,所述层次化特征与多粒度特征计算成对的自注意力并取平均值得多粒度交互特征,基于层次化语义对齐损失函数对齐两种模态之间的相关性。目的是探索图像和文本模态之间的多粒度互动相关性,以提高跨模态检索性能。

Patent Agency Ranking