-
公开(公告)号:CN116912568A
公开(公告)日:2023-10-20
申请号:CN202310845587.5
申请日:2023-07-10
Applicant: 南京理工大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/047 , G06N3/08
Abstract: 本发明提出了一种基于自适应类别均衡的含噪声标签图像识别方法。具体来说,首先设计了一种新颖的样本选择策略,在识别干净和噪声数据时增强自适应性和类平衡性。然后采用均值‑教师模型对含噪样本的标签进行修正。随后,提出了一种自适应和类别平衡的样本重加权机制,为检测到的噪声样本分配不同的权重。最后,在选择的干净样本上额外使用一致性正则化来提高模型的泛化性能。
-
公开(公告)号:CN113159294A
公开(公告)日:2021-07-23
申请号:CN202110458211.X
申请日:2021-04-27
Applicant: 南京理工大学
Abstract: 本发明公开了基于同伴学习的样本选择算法,包括以下步骤:(1)同时训练两个深度卷积神经网络,将图像输入两个网络分别进行前向计算,预测图像类别,计算交叉熵损失;(2)两个网络利用预测结果不一致的样本更新自身网络参数;(3)两个网络从预测一致的样本中选取低损失值的样本互相更新对方网络参数。本发明两个同伴子网络通过“自我学习”(利用网络预测不一致的样本更新网络)和“相互交流”(交换网络预测一致的样本来更新网络)来提升最终的识别性能,有效应对了网络图像数据集存在的标签噪声问题。另外,本发明能有效地从含标签噪声的数据集中选取出对模型训练有益的样本,可广泛应用于各类标签不可靠的场景任务下。
-
公开(公告)号:CN111861909A
公开(公告)日:2020-10-30
申请号:CN202010604384.3
申请日:2020-06-29
Applicant: 南京理工大学
Abstract: 本发明公开了一种网络细粒度图像去噪分类方法,使用深度神经网络进行预训练并记录和更新最近几次的预测历史,预训练后通过全局样本选择和动态不确定性损失修正来让神经网络在含有噪声的训练集中进行鲁棒地学习。本发明通过进行样本选择和不确定性损失校正,网络图像数据集可以直接用于细粒度视觉分类训练,获得仅略低于干净的人工标注数据集的准确率。
-
公开(公告)号:CN111782833A
公开(公告)日:2020-10-16
申请号:CN202010526211.4
申请日:2020-06-09
Applicant: 南京理工大学
IPC: G06F16/483 , G06K9/62 , G06N3/04 , G06N3/08 , G06F40/284 , G06F17/14
Abstract: 本发明公开了一种基于多模型网络的细粒度跨媒体检索方法,包括:获取跨媒体数据集,对跨媒体数据集进行预处理获取跨媒体数据;分别提取各媒体数据的专有特征;提取各媒体数据的公共特征;对跨媒体数据的专有特征和公共特征进行加权求和,获取最终的联合特征;利用余弦距离测量不同媒体特征之间的相似度并按相似度对媒体特征进行排序。本发明构建了媒体专有网络和公共网络,媒体专有网络包含各媒体的特征提取器用于提取各媒体的专有特征;公共网络包含能同时学习四种媒体的统一的网络用于提取各媒体的公共特征,两种网络的结合实现了在最大限度保留各媒体特征的同时消除各媒体间的异构鸿沟,从而实现有效的跨媒体检索,具有广阔的应用前景。
-
公开(公告)号:CN119919782A
公开(公告)日:2025-05-02
申请号:CN202411977128.3
申请日:2024-12-30
Applicant: 南京理工大学
IPC: G06V20/00 , G06V10/52 , G06V10/771 , G06V10/80 , G06V10/77 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于选择性特征空间融合的遥感目标检测方法及系统,属于计算机视觉的遥感目标检测领域,其技术方案要点是:首先将输入遥感目标图像经骨干网络提取的多尺度特征,通过卷积层和组归一化层进行映射处理,得到不同阶段的特征图,之后对不同阶段的特征图进行空间维度对齐和通道拼接操作,并利用通道注意力机制对拼接后的特征进行精炼,并对精炼后的特征进行池化、大核卷积及激活函数处理,得到选择性特征空间注意力权重,紧接着对通过得到的选择性特征空间注意力权重对特征图中的空间信息进行加权并相加融合,本发明提高了遥感目标检测中对于目标的检测能力,以应对遥感图像的多样性、目标大尺寸以及复杂性的问题。
-
公开(公告)号:CN118062251A
公开(公告)日:2024-05-24
申请号:CN202410067248.3
申请日:2024-01-17
Applicant: 南京理工大学
IPC: B64F1/36 , B64F1/16 , G01C21/20 , H04L67/125
Abstract: 本发明公开了一种飞机轮档自动拆放系统,涉及飞机轮挡安装拆卸技术领域;轮挡机器人包括全动地面行走底盘、轮挡抓取与传输机构、自主导航传感器系统、智能化自主导航软件、通讯系统和遥控系统;全动地面行走底盘,包括若干个带动力的轮子和固定底板,且轮挡抓取与传输机构包括一个传送带和一个电动锤抓手,并且轮挡抓取与传输机构与全动地面行走底盘右侧连接;全动地面行走底盘与自主导航传感器系统、智能化自主导航软件、通讯系统和遥控系统连接。由于本发明设有一个轮挡机器人,且轮挡机器人内部配有全动地面行走底盘、轮挡抓取与传输机构、自主导航传感器系统和通讯系统等设备,使得该系统可以自主执行轮档拆放工作。
-
公开(公告)号:CN117314843A
公开(公告)日:2023-12-29
申请号:CN202311187981.0
申请日:2023-09-14
Applicant: 南京理工大学
Abstract: 本发明公开了一种基于图像处理的干电池负极盖瑕疵检测与识别方法,包括:对相机进行标定与图像校正;利用相机拍摄电池图像,采用中值滤波来预处理将要进行电池定位的初始图像;对预处理后的图像进行处理,实现对电池图像的定位;对电池区域进行分割,分割为内圆、内环、外环三部分;对分割后的各个部分的图像进行图像增强;对图像增强后的图像进行瑕疵检测与识别。本发明能够提取电池负极面的特征并有效识别出典型瑕疵,分为坑孔、漏液、划痕三类。
-
公开(公告)号:CN116840241A
公开(公告)日:2023-10-03
申请号:CN202310933553.1
申请日:2023-07-27
Applicant: 南京理工大学
IPC: G01N21/88 , G01N21/952
Abstract: 本发明提出了一种基于机器视觉的圆柱形干电池负极面缺陷检测方法,具体为:对相机参数进行矫正;采集电池负极面全局图像,并对全局图像进行预处理和霍夫变换,识别出变形的电池样本图像并去除所述电池样本图像;对电池负极面进行缺陷检测,所述缺陷检测包括外观缺陷检测以及划痕和坑孔检测。本发明能够识别由于电池表面划痕、凹陷、脱皮、缺口、卷边皱、卷边三角、负极盖倾斜和密封圈外漏等问题引起的缺陷情况。
-
公开(公告)号:CN113159066B
公开(公告)日:2022-08-30
申请号:CN202110386579.X
申请日:2021-04-12
Applicant: 南京理工大学
Abstract: 本发明公开了基于类间相似度的分布式标签的细粒度图像识别算法,包括以下步骤:(1)使用骨干网络提取输入图像的特征表示;(2)利用中心损失模块通过特征表示计算中心损失并更新类别中心;(3)分类损失模块利用特征表示和最终标签分布计算分类损失(例如交叉熵损失),其中的最终标签分布通过计算独热标签分布和由类别中心生成的分布式标签分布的加权和得到;(4)由中心损失和分类损失加权求和得到最终的目标损失函数,以此优化整个模型。本发明通过降低模型预测的确信度有效地缓解了过拟合的问题,能够精确地学习细粒度数据的辨别性特征,精确高效地区分不同细粒度类别的数据,可广泛应用于视觉分类和多媒体领域。
-
公开(公告)号:CN112800249A
公开(公告)日:2021-05-14
申请号:CN202110133925.3
申请日:2021-02-01
Applicant: 南京理工大学
IPC: G06F16/435 , G06F16/438 , G06F16/483 , G06N3/04 , G06N3/08
Abstract: 本发明公开了基于生成对抗网络的细粒度跨媒体检索方法,包括以下步骤:(1)对视频数据进行噪声帧滤除操作;(2)构造双通道的特征提取网络;(3)构建基于生成对抗网络的细粒度跨媒体检索模型,该模型包含一个生成器和一个媒体判别器,对抗训练之后得到跨媒体数据的公共特征表示;(4)对公共特征空间的特征进行相似性度量,并按照相似性排序,找到与输入的细粒度数据相似性较高的数据进行输出。本发明能够精确地学习细粒度数据的辨别性特征,快速准确地检索到与输入数据具有较高相似性的多种媒体数据,可广泛应用于各种多媒体领域。
-
-
-
-
-
-
-
-
-