-
公开(公告)号:CN118968050A
公开(公告)日:2024-11-15
申请号:CN202410946290.2
申请日:2024-07-15
Applicant: 南京工业大学
Abstract: 一种利用双分支边界混合网络指导城市场景语义分割的方法,步骤包括:步骤一、为RGB图像构造高效的主干分支网络确保其在网络更轻量情况下保持提取完整的语义信息的能力;步骤二、为热红外图像构建边界信息提取分支,通过边界信息补充RGB图像在提取语义信息时的细节信息损耗;步骤三、构建双分支混合模块来融合主干分支和边界分支的信息,并通过注意力机制对混合的特征进行微调来保证融合特征的信息高可用性;步骤四、设计更高效的混合损失函数针对整体网络架构的不同分支进行约束,并在总损失函数中融合了困难样本挖掘的思想来更有效的分割出以往工作中难以实现的困难场景。
-
公开(公告)号:CN111275137B
公开(公告)日:2023-07-18
申请号:CN202010222007.3
申请日:2020-03-26
Applicant: 南京工业大学
IPC: G06V10/764 , G06V10/774 , G06V10/74 , G06V10/75 , G06V10/82 , G06N3/045 , G06Q30/018
Abstract: 本发明公开了一种基于专属孪生网络模型的茶叶验真方法,为每一类茶叶都配备一个专属孪生网络模型自动提取出目标茶叶所独有的隐式特征进行验证。该模型输入为目标茶叶与任意一种茶叶样本的组合,并以VGG16为基准结构提取它们的特征向量,最后将两个通道降维向量的L1距离进行逻辑回归,如果茶叶类别一致,则逻辑回归值为1,否则为0。此外,在测试阶段,首先将待验证茶叶图片转换到HSV空间,使用直方图规定化的方法对其进行图像颜色校准,使其在亮度和色调方面与训练时的采样图片接近,解决了因设备差异而导致的验真准确率低的问题。本发明相比于直接使用全分类模型,更加高效可靠,能够准确的判断或验证用户所购买的茶叶是否为真。
-
公开(公告)号:CN114612726B
公开(公告)日:2024-12-20
申请号:CN202210286505.3
申请日:2022-03-22
Applicant: 南京工业大学
IPC: G06V10/764 , G06V10/774
Abstract: 本发明公开了一种基于字典学习的零样本图像分类方法,属于字典学习技术领域。包括获取图像数据集;对图像数据集进行预处理得到训练集和测试集;构建核心字典学习框架,并将训练集输入基于字典学习的网络模型中得到图片图像特征,基于字典学习的网络模型包括学习类模型、结构对齐、域自适应、类原型约束模块;通过计算字典学习网络模型的损失函数,对该模型中的参数进行调节;图片图像特征和语义信息特征共同训练得到分类器;将测试集输入分类器进行分类。相较于现有技术,本发明通过在基于字典学习框架网络中加入类原型约束,使生成的视觉图像特征更加多样化,提高了分类准确度。
-
公开(公告)号:CN116596881A
公开(公告)日:2023-08-15
申请号:CN202310558597.0
申请日:2023-05-17
Applicant: 南京工业大学
Abstract: 本申请公开了基于CNN和Transformer结合的主干网络和特征融合网络,主干网络中加入了MobileViT块,并在每个MobileViT块末尾结合改进后的CBMA模块以让两种特征图能够更好的融合,在连续堆叠的CNN和Transformer Block中应用CSP瓶颈结构提高网络的性能。整个模型加强了CNN和Transformer特征图的融合,有效提高了模型主干网络的特征提取能力和输出特征的接受域。加强特征提取网络(PANet)中加入一条包含Transformer Block的上采样特征提取路径,并为这种结构引入了Patch expanding用于处理Transformer特征图的上采样操作。在特征提取路径之间加入桥接块,用于对CNN和Transformer的特征层进行跳层链接,在保留局部信息的前提下加强金字塔中特征图的全局信息。本发明可对工件中形状、大小、比例、纹理特异性较大的表面缺陷目标进行检测。
-
公开(公告)号:CN111428800B
公开(公告)日:2023-07-18
申请号:CN202010236011.5
申请日:2020-03-30
Applicant: 南京工业大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464
Abstract: 本发明公开了一种基于0‑1模型的茶叶验真方法,其中0‑1模型是一个二分类模型,其中正样本是待验证的目标茶叶类型本身,标签为1;负样本是其余茶叶类型,标签为0。之后利用迁移学习的思想微调Incepton_V3得到专属于目标茶叶的0‑1模型,迫使它自动提取出最适合于区分目标茶叶的隐式特征进行验真或验假。此外,本方法在训练前使用孪生网络(Siamese Network)对负样本进行筛选,有效的缓解了正负样本不平衡问题,与现有技术相比,本发明更加高效可靠;相比于直接使用全分类模型进行茶叶分类,其验证准确率更加平稳,能够准确的判断或验证用户所购买的茶叶是否为真。
-
公开(公告)号:CN114638809A
公开(公告)日:2022-06-17
申请号:CN202210285543.7
申请日:2022-03-22
Applicant: 南京工业大学
IPC: G06T7/00 , G06V10/82 , G06V10/764 , G06V10/766 , G06V10/774 , G06V10/80 , G06N3/04 , G06N3/08 , G06K9/62
Abstract: 本申请公开了基于PA‑MLFPN工件表面多尺度微小缺陷检测方法,步骤为:构建PA‑MLFPN特征提取模型。以VGG16主干特征提取网络模型在先,PA‑MLFPN在中,预测层在后,构成检测模型。以多尺度微小缺陷目标工件表面图像为输入,以缺陷定位框和分类为输出,针对检测模型训练,获得检测模型。PA‑MLFPN首先在TUM编码器部分使用不同dilated rate的空洞卷积代替传统卷积,用平均池化操作进行下采样;并在原TUM的基础上增加一条自下而上的特征增强路径将浅层特征插值到深层中;在SFAM第二阶段引入ECA模块进行通道上的权值分配;本发明可对尺度多变且尺度较小的工件表面缺陷目标进行检测。
-
公开(公告)号:CN119672392A
公开(公告)日:2025-03-21
申请号:CN202410873628.6
申请日:2024-07-01
Applicant: 南京工业大学
IPC: G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0895 , G06V10/766 , G06N3/096
Abstract: 本申请公开了基于半监督学习的单阶段全卷积网络目标检测方法,该网络框架采用教师学生的半监督学习模型,数据集分为标签数据和无标签数据。学生模型根据标签数据和教师模型推理得到的伪标签进行训练。其中,教师学生模型均使用FCOS的单阶段全卷积网络,采用ResNet‑50网络后连接FPN网络提高模型的多尺度检测性能。对于半监督学习设置,采用代价相关的样本分配方式,相比原FCOS模型的样本分配方式,在多尺度下分配最佳正样本且不引入超参数。其次,原FCOS检测头采用共享特征,我们单独优化任务特征,采用可变形卷积计算任务相关的偏移矩阵。本发明可解决当前目标检测任务中标注成本较高的重大问题,降低标注成本同时利用大量的无标签数据实现性能提升。
-
公开(公告)号:CN111428800A
公开(公告)日:2020-07-17
申请号:CN202010236011.5
申请日:2020-03-30
Applicant: 南京工业大学
Abstract: 本发明公开了一种基于0-1模型的茶叶验真方法,其中0-1模型是一个二分类模型,其中正样本是待验证的目标茶叶类型本身,标签为1;负样本是其余茶叶类型,标签为0。之后利用迁移学习的思想微调Incepton_V3得到专属于目标茶叶的0-1模型,迫使它自动提取出最适合于区分目标茶叶的隐式特征进行验真或验假。此外,本方法在训练前使用孪生网络(Siamese Network)对负样本进行筛选,有效的缓解了正负样本不平衡问题,与现有技术相比,本发明更加高效可靠;相比于直接使用全分类模型进行茶叶分类,其验证准确率更加平稳,能够准确的判断或验证用户所购买的茶叶是否为真。
-
公开(公告)号:CN111275137A
公开(公告)日:2020-06-12
申请号:CN202010222007.3
申请日:2020-03-26
Applicant: 南京工业大学
Abstract: 本发明公开了一种基于专属孪生网络模型的茶叶验真方法,为每一类茶叶都配备一个专属孪生网络模型自动提取出目标茶叶所独有的隐式特征进行验证。该模型输入为目标茶叶与任意一种茶叶样本的组合,并以VGG16为基准结构提取它们的特征向量,最后将两个通道降维向量的L1距离进行逻辑回归,如果茶叶类别一致,则逻辑回归值为1,否则为0。此外,在测试阶段,首先将待验证茶叶图片转换到HSV空间,使用直方图规定化的方法对其进行图像颜色校准,使其在亮度和色调方面与训练时的采样图片接近,解决了因设备差异而导致的验真准确率低的问题。本发明相比于直接使用全分类模型,更加高效可靠,能够准确的判断或验证用户所购买的茶叶是否为真。
-
公开(公告)号:CN118968049A
公开(公告)日:2024-11-15
申请号:CN202410946270.5
申请日:2024-07-15
Applicant: 南京工业大学
IPC: G06V10/26 , G06V10/74 , G06V10/774 , G06V10/82 , G06N3/0895
Abstract: 本发明公布了一种基于原型跨图像语义一致性的半监督语义分割方法,该方法从语义一致性的角度出发优化了伪标签质量的问题。首先训练数据根据置信度高低选择合适的复制粘贴方法来融合数据,然后分别输入两个网络,预测结果作为交叉伪标签得到损失,接着对标记数据部分进行原型采样并将其存入语义库中,采用先进先出的队列更新方式,最后两个输出预测正确相同位置进行采样与原型进行相似度计算。本发明所述包括三个主要模块:1)训练为标记数据得到置信分数;2)添加通道、空间注意力模块关注其他区域特征;3)提取标记数据原型与未标记数据进行相似度计算。
-
-
-
-
-
-
-
-
-