-
公开(公告)号:CN119151787B
公开(公告)日:2025-03-04
申请号:CN202411639467.0
申请日:2024-11-18
Applicant: 南京信息工程大学
IPC: G06T3/4053 , G06V10/40 , G06V10/80 , G06N3/045
Abstract: 本发明公开了一种基于跨尺度令牌交互的Transformer单图像超分辨率重建方法,包括:1、获取低分辨率图像,使用浅层特征提取模块SFE从低分辨率图像中提取初步的浅层特征;2、基于若干深度特征提取块DFE构建主干网络,其中,深度特征提取块DFE包含若干跨尺度令牌交互Transformer层,将浅层特征输入主干网络中提取深层特征;3、将提取的浅层特征和深层特征融合后重建得到高分辨率图像。本发明实现不同层级令牌信息之间的交互,充分挖掘和融合图像中的跨尺度信息,并加强全局信息的交互。设计多尺度信息提取模块首先对原始像素令牌进行池化,生成区域令牌和全局令牌,从而实现多尺度信息的有效提取。
-
公开(公告)号:CN118692114A
公开(公告)日:2024-09-24
申请号:CN202411163106.3
申请日:2024-08-23
Applicant: 南京信息工程大学
IPC: G06V40/10 , G06V20/52 , G06V10/762 , G06V10/44 , G06N3/0455 , G06N3/0464 , G06N3/088
Abstract: 本发明公开了一种基于Transformer和融合聚类的对比学习无监督行人重识别方法,包括以下步骤:(1)监控摄像头拍摄行人视频上传至云端服务器,服务器对行人进行跟踪并裁剪图片;(2)使用Transformer网络提取行人图像特征;(3)融合聚类模块对提取的图像特征进行融合聚类;(4)利用多级对比学习模块获取实例之间的关系;本发明采用自动化的方式对行人进行识别,减少了人工走访调查的工作量。
-
公开(公告)号:CN118609173A
公开(公告)日:2024-09-06
申请号:CN202411089728.6
申请日:2024-08-09
Applicant: 南京信息工程大学
IPC: G06V40/10 , G06V10/143 , G06V10/40 , G06V10/74 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 本发明提出了一种基于中间模态学习的跨模态行人重识别方法及系统。其中,行人重识别方法包括如下步骤:获取成对的可见光原始图像和红外原始图像;提取可见光原始图像、红外原始图像的中间模态,得到可见光中间模态、红外中间模态;通过空间注意力和通道注意力优化所述可见光原始图像、红外原始图像、可见光中间模态、红外中间模态,输出优化结果;建立损失约束限制所述优化结果,输出识别结果。本发明提出了一个主要由中间模态图片生成器、双重注意力组合块以及特征损失约束组成的中间模态学习网络,具有精度高、还原度高的特点。
-
公开(公告)号:CN118072361B
公开(公告)日:2024-07-12
申请号:CN202410496315.3
申请日:2024-04-24
Applicant: 南京信息工程大学
IPC: G06V40/10 , G06V20/52 , G06V20/40 , G06V10/40 , G06V10/74 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06V10/62
Abstract: 本发明公开了一种基于随机游走的小股行人重识别方法及系统,所述方法包括以下步骤:(1)捕捉到的行人视频并进行预处理;(2)将图片通过单目估计算法得到深度图,并对单人深度图计算深度平均值;通过vision transformer得到行人特征,将行人特征通过按深度平均值大小依次构建成具有不同节点的图结构;(3)通过随机游走模块对图进行重构,每添加一个图节点计算该探针图像和图库图像之间的亲和力分数,并计算该组成员的亲和力分数平均值,得到亲和力分数平均值最高的图;(4)将重构的图在图间通过组上下文信息传递,更新图节点特征,结合注意力机制,进行组匹配,预测两组的匹配得分;本发明节约了大量的人力成本和时间成本。
-
公开(公告)号:CN115829880A
公开(公告)日:2023-03-21
申请号:CN202211664365.5
申请日:2022-12-23
Applicant: 南京信息工程大学
IPC: G06T5/00 , G06T7/40 , G06N3/0455 , G06N3/0475
Abstract: 本发明公开了基于上下文结构注意力金字塔网络的图像修复方法,包括:使用CelebA‑HQ和Places2数据集,整理分割成训练集和数据集,并进行预处理;构建基于结构注意力机制的金字塔网络,并使用训练集进行训练建模,得到初始图像修复模型;使用该模型对测试集进行修复;并通过指标评价该模型的修复能力。本发明使用U‑Net结构作为主干,将上下文从低级像素编码为高级语义特征,并反向解码为图像。通过逐层由深至浅的结构注意力转移填补缺失区域,可以提高合成纹理与生成结构的一致性,并且可以恢复更具细粒度细节的图像。相较于现有算法,本发明的算法鲁棒性和普适性强,且修复效果更好。
-
公开(公告)号:CN115457395A
公开(公告)日:2022-12-09
申请号:CN202211155626.0
申请日:2022-09-22
Applicant: 南京信息工程大学
IPC: G06V20/10 , G06V10/25 , G06V10/762 , G06V10/80 , G06V10/82
Abstract: 本发明公开了基于通道注意力与多尺度特征融合的轻量级遥感目标检测方法,包括:获取遥感数据;将遥感数据中的图片输入训练好的遥感目标检测模型;根据模型的输出,确定遥感目标检测结果;模型的构建训练方法包括:获取数据集,使用Kmeans聚类算法对数据集作聚类处理,获得一组锚框;构建主干网络提取特征图;在主干网络后构建快速空间金字塔池化结构进行特征融合;构建三层的加强特征提取网络BiFPN,融合浅层特征图的空间信息与深层特征图的语义信息;在BiFPN后构建通道注意力模块ECA;在ECA后构建三个预测输出头,进行预测;利用数据集及锚框训练并评估模型。网络参数少计算量小,提高了检测精度的同时满足了实时性。
-
公开(公告)号:CN114881873A
公开(公告)日:2022-08-09
申请号:CN202210411643.X
申请日:2022-04-19
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于曲线学习和Transformer的图像增强方法。本发明以基于学习的方式提取低照度图像的特征,并自动生成像素变换曲线,实现图像亮度的增强和局部对比度的拉伸。将曲线变换抽象成像素的对应变换,以8位数字图像为例,它的像素范围为0~255的整数,像素的对应则可以表示为256维的向量。为了提高图像的自然性,在损失函数中加入对改向量的一维拉普拉斯正则项,保证变换曲线的平滑性和单调性,使得变换后的像素大小关系仍保持不变。此外,为了减少增强图像中的噪声,引入BM3D去噪算法,根据可以一定程度上反应噪声识别的变换曲线的斜率,对不同的区域施以不同的程度的去噪,更好地去除增强图像中的噪声。
-
公开(公告)号:CN105225176B
公开(公告)日:2018-12-21
申请号:CN201510556765.8
申请日:2015-09-02
Applicant: 南京信息工程大学
IPC: G06Q50/18
Abstract: 一种权证基础信息管理系统,包括权证信息数据录入模块;系统自动提示模块;信息查询模块;信息统计模块;系统维护模块和电子地图模块;整个系统中的权证信息数据录入、信息查询、信息统计模块均以控股公司的机构组织结构为总框架,机构隶属地区、机构类型、具体权证法律文件及期限为提示监督主要提示符;机构为控股公司的独立经营单位;所有上述模块共用一个数据后台,保证数据的可靠性和唯一性;系统自动提示模块的功能对到期权证自动提示,根据到期的时限,分为红、橙、蓝三种提示状态;凡有有效期限的权证,有效期限的权证与检索日期比较,需按“距到期还有不到一个月”、“已过期”进行列表查询,表单需有“有效期至”一项。
-
公开(公告)号:CN105469371B
公开(公告)日:2018-11-27
申请号:CN201511023720.0
申请日:2015-12-30
Applicant: 南京信息工程大学
IPC: G06T5/00
Abstract: 本发明一种基于双字典学习的非局部稀疏表示图像去噪方法改进了Dong非局部稀疏表示模型中所用到传统的Kmeans聚类方法,具体利用聚类中心字典学习方法分析与挖掘各相似类间的相关性,并将这一相关性引入传统的Kmeans聚类方法,以提高聚类的准确性,从而达到增强稀疏表示模型性能的目的。本发明包括:对待去噪图像,利用kmeans聚类方法,产生各类;计算各类中心图片;利用聚类中心字典学习方法,得到各聚类中心的稀疏表示,继而重建各聚类中心图像块;更新传统Kmeans结果中的聚类中心;循环,直至满足结束条件;构建各类对应的紧致PCA字典;构造类内图像片稀疏编码误差项;利用迭代收敛算法求解。
-
-
-
-
-
-
-
-
-