-
公开(公告)号:CN103761533A
公开(公告)日:2014-04-30
申请号:CN201410026937.6
申请日:2014-01-21
Applicant: 南京信息工程大学
Inventor: 刘茜
IPC: G06K9/62
Abstract: 本发明公开了基于核鉴别线性表示的分类方法,利用训练样本集识别测试样本所属的类别。首先对训练样本集和测试样本中的所有样本分别进行预处理,得到新的训练样本集和新的测试样本,各个样本类别的新的训练样本构成新的子训练样本集,然后计算新的测试样本在各个新的子训练样本集内的重构误差,最后将测试样本归为重构误差最小的新的子训练样本集所对应的那一类,所述预处理为采用核主成分分析方法对待处理样本做降维运算,再对降维后的所有样本做归一化运算。本发明基于核鉴别线性表示的分类方法相较于现有技术大大提高了识别精度。
-
公开(公告)号:CN103761511A
公开(公告)日:2014-04-30
申请号:CN201410021022.6
申请日:2014-01-17
Applicant: 南京信息工程大学
Inventor: 刘茜
Abstract: 本发明公开了基于RGB彩色特征双重流形鉴别分析的彩色人脸识别方法,属于图像识别的技术领域,假设每一类的所有彩色分量样本构成一个非线性的流形,使用基于欧式距离的分层K-means算法在每个流形上划分局部线性模型;构造内部图和惩罚图,定义内部图和惩罚图的相似性矩阵;定义目标函数并求解,得到投影后的训练样本特征集和投影后的测试样本特征;计算测试样本特征到训练样本特征的欧式距离后将其归到距离最小的那个训练样本所在的类。本发明将流形鉴别分析技术同时应用到R、G、B三个彩色分量内部和三个彩色分量之间,在各个彩色分量内部和不同彩色分量之间实现特征层双重流形鉴别分析,增强了鉴别特征的分类能力。
-
公开(公告)号:CN118644486B
公开(公告)日:2024-11-15
申请号:CN202411117386.4
申请日:2024-08-15
Applicant: 南京信息工程大学
Abstract: 本发明公开了基于双路多尺度融合网络的人群计数方法、系统,该方法包括获取人群图像数据集并进行预处理,将预处理后的数据集划分成训练集、验证集和测试集;利用标注图获得真实人群密度图;构建双路多尺度融合网络,该网络包括特征提取网络、自注意力特征增强模块、空间注意力多尺度特征融合模块、残差注意力特征融合模块和密度图生成模块;利用训练集和验证集对双路多尺度融合网络进行训练,获得训练后的双路多尺度融合网络;将测试集输入到训练后的双路多尺度融合网络,得到人群图像计数结果。本发明加强特征在通道层面上的偏好,并利用残差链接进行特征重用,充分利用各个阶段的特征,提高人群图像的计数准确性。
-
公开(公告)号:CN116311004A
公开(公告)日:2023-06-23
申请号:CN202310582135.2
申请日:2023-05-23
Applicant: 南京信息工程大学
Abstract: 本申请涉及一种基于稀疏光流提取的视频运动目标检测方法。该方法包括:将待检测视频中的视频帧进行稀疏化的增强处理,获得增强后的视频输入浅层特征提取模块,生成第一、第二和第三浅层特征图,将第三浅层特征图输入深层特征提取模块,生成第一、第二和第三深层特征图,将第一、第二和第三深层特征图输入深层特征融合模块,获得深层特征融合图,将深层特征融合图、第一、第二和第三浅层特征图输入深浅层特征融合模块,获得深浅层融合特征,将第二和第三深层特征图、深层特征融合图、深浅层融合特征输入检测模块,获得视频运动目标检测结果。提高了视频运动目标检测的准确率。
-
公开(公告)号:CN116229073A
公开(公告)日:2023-06-06
申请号:CN202310225930.6
申请日:2023-03-08
Applicant: 南京信息工程大学
IPC: G06V10/26 , G06V20/10 , G06V20/70 , G06V10/52 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于改进型ERFNet网络的遥感图像分割方法及装置,涉及图像语义分割技术领域;通过获取遥感图像;将遥感图像输入到训练后的改进型ERFNet语义分割网络模型中,得到遥感图像分割结果,其中:所述改进型ERFNet语义分割网络模型包括添加注意力金字塔池化模块的编码器模块和使用光流指导对齐模块替换反卷积的解码器模块;相较于传统ERFNet网络,本发明在编码器中增加了注意力金字塔池化模块,使用光流指导对齐模块代替解码器中反卷积,充分融合了多尺度信息,确保图像还原准确度,有效提高了遥感高分辨率图像中的小物体以及整体图像的分割精度。
-
公开(公告)号:CN116071709A
公开(公告)日:2023-05-05
申请号:CN202310333635.2
申请日:2023-03-31
Applicant: 南京信息工程大学
IPC: G06V20/52 , G06V10/40 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明公开了图像处理领域的一种基于改进型VGG16网络的人群计数方法、系统及存储介质,方法包括:采集监控场景的实时人群图像;将实时人群图像输入至预训练后的人群计数网络模型,获得对实时人群图像的计数结果;所述人群计数网络模型包括:改进原始VGG16网络,去除最后三个全连接层;充分融合不同层级语义特征;并增加了多尺度膨胀卷积块,充分融合了多尺度信息;以及分类分支辅助完成计数任务;有效解决了拥挤环境下人头较小不易检测的问题,提高整体图像的计数准确性,同时可以直观地看到人群在图片中所在的位置。
-
公开(公告)号:CN113326738A
公开(公告)日:2021-08-31
申请号:CN202110491698.1
申请日:2021-05-06
Applicant: 南京信息工程大学
Inventor: 刘茜
Abstract: 本发明公开了一种基于深度网络和字典学习的行人目标检测与重识别方法,包括:1)使用不同场景的两个摄像机,构建行人数据集;2)为每个摄像机构建一个改进型SSD网络;3)对行人特征提取子网络输出的行人特征,构建共同的半监督迁移字典学习模块;4)利用行人数据集训练两个改进型SSD网络和半监督迁移字典学习模块,获得端到端的行人目标检测与重识别系统;5)将待识别的行人图像或视频输入行人目标检测与重识别系统,输出行人目标检测和重识别结果。本发明实现了行人目标检测与重识别的端到端系统模型,充分利用无标记训练样本参与深度网络和字典的学习,有效增强行人目标检测与重识别能力。
-
公开(公告)号:CN112906677B
公开(公告)日:2021-08-03
申请号:CN202110488919.X
申请日:2021-05-06
Applicant: 南京信息工程大学
Abstract: 本发明公开了基于改进型SSD网络的行人目标检测与重识别方法,涉及目标检测与重识别技术领域,将目标场景下的视频集中的视频转换为有效视频帧图像序列,并对序列中的每一幅图像进行处理,构成视频数据集,构建与视频数据集对应的SSD网络,随后获得改进型SSD网络;分别针对各个改进型SSD网络,利用视频数据集中的有效视频帧图像对该改进型SSD网络进行训练,获得目标检测与重识别系统;利用目标检测与重识别系统,获得视频的目标检测与重识别结果。通过本发明的技术方案,实现了对行人目标的整体识别、以及局部识别,充分利用多尺度的全局和局部信息,有效提高目标检测和重识别的精确度,并减少整个检测识别过程所耗费的时间。
-
-
公开(公告)号:CN107392190A
公开(公告)日:2017-11-24
申请号:CN201710800074.7
申请日:2017-09-07
Applicant: 南京信息工程大学
Abstract: 本发明公开了基于半监督多视图字典学习的彩色人脸识别方法,该方法将多视图学习技术应用于半监督彩色人脸图像的字典学习。在训练阶段,该方法通过分别学习各个彩色分量的结构化字典并令这些字典互相正交来去除各个彩色分量之间的相关性,充分利用各个彩色分量之间互补的色彩差异信息;并且该方法在字典学习过程中使用无类别标记的彩色人脸图像样本参与训练,充分利用所有训练样本信息。在分类测试阶段,该方法累计各个彩色分量用对应每一类训练样本的字典去重构测试样本的重构误差,最后将测试样本归为累计重构误差最小的那一类。本发明识别效果更高,通过半监督多视图字典学习,彩色人脸识别能力得到了明显增强。
-
-
-
-
-
-
-
-
-