-
公开(公告)号:CN119478527A
公开(公告)日:2025-02-18
申请号:CN202411611221.2
申请日:2024-11-12
Applicant: 南京理工大学
IPC: G06V10/764 , G06V10/82 , G06V10/80 , G06V10/774 , G06N3/0464 , G06V10/40 , G06V10/74 , G06V40/10
Abstract: 本发明公开了一种基于多尺度特征融合的对动物图像的零样本分类方法,该方法包括:通过利用ResNet101第三层与第四层的不同尺度特征,在零样本分类任务中进行局部特征的挖掘;将第三层与第四层特征输入多尺度特征增强模块,增强特征判别性;设立跨层融合模块,通过学习对方层的特征产生交互,增强模型泛化能力;将同层的特征融合,并输入到属性关注模块。本发明充分利用了不同层的特征信息,减少了零样本分类任务中,模型对可见类的偏见,提升了广义零样本和零样本分类的准确性。
-
公开(公告)号:CN117197568A
公开(公告)日:2023-12-08
申请号:CN202311167370.X
申请日:2023-09-12
Applicant: 南京理工大学
IPC: G06V10/764 , G06V10/82 , G06N3/042 , G06N3/0464 , G06N3/096
Abstract: 本发明公开了一种基于CLIP的零样本图像识别方法,通过对由语义引导的细粒度局部视觉特征定位,并且利用双网络的特征对齐,微调属性特征提示,从而获得优异的零样本知识迁移能力,得到更精确的零样本图像分类结果。在三个经典的图像分类数据集CUB,SUN和AWA2的传统零样本基准测试上分别达到84%,89.8%和97.4%的正确率,广义零样本基准测试上分别达到75.9%,68.4%和92.6%的H值,是目前结果最好的模型。证明本方法可以通过学习已见类图像的先验知识,并且利用双网络的特征对齐,微调属性特征提示从而精确的识别未见类图像。
-
公开(公告)号:CN118799704A
公开(公告)日:2024-10-18
申请号:CN202410911049.6
申请日:2024-07-09
Applicant: 南京理工大学
IPC: G06V10/82 , G06V10/774 , G06V10/764 , G06V10/80 , G06N3/0464 , G06N3/09 , G06N3/096
Abstract: 本发明公开了一种基于零样本曼巴模型的图像识别方法,通过四种图像扫描策略确保了特征图中的每个元素都能够整合来自不同方向的信息。采用状态空间模型,特别是曼巴,对特征进行运算处理。使模型能够保持在保持线性计算复杂度的同时,对输入有着全局视野。在三个经典的图像分类数据集CUB,SUN和AWA2的传统零样本基准测试上得到,比传统ResNet、ViT模型提取的特征拥有更好的性能。证明本方法可以通过学习已见类图像的先验知识,并且利用曼巴模型的对全局图像特征进行学习,从而精确的识别未见类图像。
-
公开(公告)号:CN115880768A
公开(公告)日:2023-03-31
申请号:CN202211398752.9
申请日:2022-11-09
Applicant: 南京理工大学
IPC: G06V40/20 , G06V10/40 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种骨骼动作识别模型半监督学习方法,提出了一种新的金字塔自注意力聚合学习(PSPL)框架,通过对比学习来学习涵盖从粗到细粒度信息的更全面的动作表示。在PSPL中,引入金字塔聚合注意力(PPA),从身体‑部位‑关节三个级别聚合身体级别注意力图、部位级别注意力图和关节级别注意力图,从粗粒度到细粒度补充骨骼动作的语义信息;其次,通过粗到细粒度对比损失(CCL)来衡量关节与运动模态之间身体/部位/关节级别对比特征的相似性。
-
-
-