-
公开(公告)号:CN117934891A
公开(公告)日:2024-04-26
申请号:CN202410343857.7
申请日:2024-03-25
Applicant: 南京信息工程大学
IPC: G06V10/762 , G06V10/40 , G06V10/82 , G06N3/0464 , G06N3/084 , G06N3/042
Abstract: 本发明提供一种基于图结构的图像对比聚类方法及系统,涉及机器学习和图像处理领域。该方法包含以下步骤,获取原始图像数据集,对原始图像数据集进行两种不同的变换,分获取变换后的数据集的特征和对比特征,计算实例级对比损失,获取并更新每个样本的邻居,获取邻接矩阵并加上不同的随机掩码,构建图结构数据,输入到图神经网络聚合特征与其邻居特征,并获得聚类分配,计算簇级对比损失,通过实例级对比损失和簇级对比损失优化特征提取网络、对比网络和图卷积神经网络,重复上述步骤,直到满足迭代次数,输出聚类分组结果;本发明方法不仅能获取图像的语义信息,也能有效挖掘图像数据之间的结构信息。
-
公开(公告)号:CN116310750A
公开(公告)日:2023-06-23
申请号:CN202211721584.2
申请日:2022-12-30
Applicant: 南京信息工程大学
IPC: G06V20/00 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本发明公开了一种基于雾天场景的交通检测方法、装置及存储介质,所述方法包括获取PASCAL‑VOC2012数据集,使用大气散射模型方程对数据集进行雾化处理,生成不同浓度的雾天图像;通过卷积神经网络学习雾天图像上的雾因子分布,根据雾因子分布过滤特征因子还原无雾图像;将还原的无雾图像利用gamma滤波对图像明暗程度进行增强,获得增强后的无雾图片;将增强后的无雾图片输入到预先训练过的检测网络模型中,识别图像的目标边界框,本发明具有检测精度高、实时性和应用性较强、漏检率低等优点,提升了检测模型在雾天场景中的表现。
-
公开(公告)号:CN111353443B
公开(公告)日:2023-06-20
申请号:CN202010141525.2
申请日:2020-03-02
Applicant: 南京信息工程大学
IPC: G06V40/10 , G06V10/77 , G06V10/764
Abstract: 本发明涉及一种基于跨视图核协同表示的行人再识别方法,属于行人再识别技术领域。本发明的方法首先对数据集进行预处理,然后划分训练、测试集,再进行特征提取与降维;并进行跨视图核协同表示,最后识别待测样本。本发明采用了跨视图核协同表示方法,按照不同的视图分别处理样本,用CRC协同表示同一视图下的样本得到该视图所有样本的协同表示编码,然后对不同视图下同一个人的协同表示编码加上彼此相似性约束,最后将不同视图的CRC模型和编码相似性约束整合到同一个多任务学习框架中,联合地学习跨视图样本的协同表示编码,通过这种方式使CRC更适用于行人再识别任务。因此,本方法应对跨视图行人图像间的外观差异具有更强的鲁棒性。
-
公开(公告)号:CN112183468A
公开(公告)日:2021-01-05
申请号:CN202011160779.5
申请日:2020-10-27
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于多注意力联合多级特征的行人再识别方法。属于计算机视觉领域;具体步骤:1、图片预处理和设定训练次数;2、判断是否达到最大训练次数;3、通过训练卷积神经网络模型得到特征与预测标签;4、根据损失函数对网络参数进行更新;5、保存当前模型参数,将其用于训练完成后的测试,再次进入步骤2。本发明融合了卷积神经网络高层次的语义特征与低层次的特征,且对融合后的特征进行注意力加权的操作后进行分块重组的步骤;特征被分块重组后,其可以在不同的尺度上进行匹配,并且通过设计的新型分类器来获取图像的最后特征表达用于行人重识别的识别任务;将二者结合,将提高行人重识别的准确率。
-
公开(公告)号:CN119151787B
公开(公告)日:2025-03-04
申请号:CN202411639467.0
申请日:2024-11-18
Applicant: 南京信息工程大学
IPC: G06T3/4053 , G06V10/40 , G06V10/80 , G06N3/045
Abstract: 本发明公开了一种基于跨尺度令牌交互的Transformer单图像超分辨率重建方法,包括:1、获取低分辨率图像,使用浅层特征提取模块SFE从低分辨率图像中提取初步的浅层特征;2、基于若干深度特征提取块DFE构建主干网络,其中,深度特征提取块DFE包含若干跨尺度令牌交互Transformer层,将浅层特征输入主干网络中提取深层特征;3、将提取的浅层特征和深层特征融合后重建得到高分辨率图像。本发明实现不同层级令牌信息之间的交互,充分挖掘和融合图像中的跨尺度信息,并加强全局信息的交互。设计多尺度信息提取模块首先对原始像素令牌进行池化,生成区域令牌和全局令牌,从而实现多尺度信息的有效提取。
-
公开(公告)号:CN118692114A
公开(公告)日:2024-09-24
申请号:CN202411163106.3
申请日:2024-08-23
Applicant: 南京信息工程大学
IPC: G06V40/10 , G06V20/52 , G06V10/762 , G06V10/44 , G06N3/0455 , G06N3/0464 , G06N3/088
Abstract: 本发明公开了一种基于Transformer和融合聚类的对比学习无监督行人重识别方法,包括以下步骤:(1)监控摄像头拍摄行人视频上传至云端服务器,服务器对行人进行跟踪并裁剪图片;(2)使用Transformer网络提取行人图像特征;(3)融合聚类模块对提取的图像特征进行融合聚类;(4)利用多级对比学习模块获取实例之间的关系;本发明采用自动化的方式对行人进行识别,减少了人工走访调查的工作量。
-
公开(公告)号:CN118609173A
公开(公告)日:2024-09-06
申请号:CN202411089728.6
申请日:2024-08-09
Applicant: 南京信息工程大学
IPC: G06V40/10 , G06V10/143 , G06V10/40 , G06V10/74 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 本发明提出了一种基于中间模态学习的跨模态行人重识别方法及系统。其中,行人重识别方法包括如下步骤:获取成对的可见光原始图像和红外原始图像;提取可见光原始图像、红外原始图像的中间模态,得到可见光中间模态、红外中间模态;通过空间注意力和通道注意力优化所述可见光原始图像、红外原始图像、可见光中间模态、红外中间模态,输出优化结果;建立损失约束限制所述优化结果,输出识别结果。本发明提出了一个主要由中间模态图片生成器、双重注意力组合块以及特征损失约束组成的中间模态学习网络,具有精度高、还原度高的特点。
-
公开(公告)号:CN118072361B
公开(公告)日:2024-07-12
申请号:CN202410496315.3
申请日:2024-04-24
Applicant: 南京信息工程大学
IPC: G06V40/10 , G06V20/52 , G06V20/40 , G06V10/40 , G06V10/74 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06V10/62
Abstract: 本发明公开了一种基于随机游走的小股行人重识别方法及系统,所述方法包括以下步骤:(1)捕捉到的行人视频并进行预处理;(2)将图片通过单目估计算法得到深度图,并对单人深度图计算深度平均值;通过vision transformer得到行人特征,将行人特征通过按深度平均值大小依次构建成具有不同节点的图结构;(3)通过随机游走模块对图进行重构,每添加一个图节点计算该探针图像和图库图像之间的亲和力分数,并计算该组成员的亲和力分数平均值,得到亲和力分数平均值最高的图;(4)将重构的图在图间通过组上下文信息传递,更新图节点特征,结合注意力机制,进行组匹配,预测两组的匹配得分;本发明节约了大量的人力成本和时间成本。
-
公开(公告)号:CN117635973B
公开(公告)日:2024-05-10
申请号:CN202311661718.0
申请日:2023-12-06
Applicant: 南京信息工程大学
IPC: G06V10/62 , G06V20/52 , G06V20/40 , G06V40/10 , G06V10/26 , G06V10/25 , G06V10/44 , G06V10/42 , G06V10/52 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/084
Abstract: 本发明公开了一种基于多层动态集中和局部金字塔聚合的换衣行人重识别方法,包括以下步骤:(1)对图像数据集添加风雨场景并执行标准化预处理及数据增强操作;(2)构建输入到Transformer模型的序列;(3)构建基于标准Transformer架构的行人特征提取网络;(4)利用多层动态聚焦模块,对得到的Transformer各层特征进行动态权重调整与融合处理;(5)通过局部金字塔聚合模块选择性地提取并融合Transformer网络中的特定层特征,以获取多尺度特征信息;(6)根据步骤(4)‑(5)所得的特征输出应用于损失函数,以验证查询图像与测试图像是否为同一类别,从而完成模型的训练和优化;本发明在复杂场景下,尤其是面对换衣行人重识别任务时,能够显著提升算法的识别精度和鲁棒性。
-
公开(公告)号:CN117612266A
公开(公告)日:2024-02-27
申请号:CN202410095404.7
申请日:2024-01-24
Applicant: 南京信息工程大学
IPC: G06V40/20 , G06V20/40 , G06V20/52 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06V10/62
Abstract: 本发明公开了一种基于多尺度图像及特征层对齐的跨分辨率行人重识别方法,所述方法包括:对跨分辨率样本视频进行预处理,将视频分割为连续的帧,并统一图像尺寸,选取高分辨率行人图像和低分辨率行人图像;对高分辨率行人图像进行多尺度下采样,对多尺度的图像重构网络进行训练;每个尺度的重构图像输入到与图像重构网络对应连接的行人重识别网络,对行人重识别网络进行训练;将待识别的视频处理后输入训练好的相应尺度的图像重构网络,重构的图像输入到对应的训练好的行人重识别网络,得到最终的行人特征表示。本发明解决跨分辨率的行人图像导致行人重识别的检索精度低、匹配效果差的问题,达到了提高低分辨率行人重识别的效果。
-
-
-
-
-
-
-
-
-