-
公开(公告)号:CN113255493B
公开(公告)日:2023-06-30
申请号:CN202110533314.8
申请日:2021-05-17
Applicant: 南京信息工程大学
IPC: G06V20/40 , G06V10/26 , G06V10/74 , G06V10/762 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种融合视觉词和自注意力机制的视频目标分割方法,属于计算机视觉技术领域。该方法包括如下步骤:首先利用固定数量的视觉词来表示感兴趣的目标,即使一个对象作为一个整体可能会受到遮挡,变形,视点变化或者从同一视频中消失并重新出现,但其某些局部部分的外观仍会保持一致,因此使用视觉词可以实现更鲁棒的匹配。然后,我们将自注意力机制用于视觉单词匹配生成的相似图,以捕获不同相似图之间的依赖关系。最后,为了解决目标对象的外观变化和视觉词不匹配问题,提出了在线更新和全局匹配机制进一步提高准确率。本发明在部分视频场景中分割精度超出同类算法,同时分割效率有明显的提升。
-
公开(公告)号:CN110390293B
公开(公告)日:2023-04-25
申请号:CN201910649351.8
申请日:2019-07-18
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于高阶能量约束的视频对象分割算法,包括以下步骤:将视频帧序列进行超像素分割;根据超像素分割结果,使用高斯混合模型,对预先给定的已标记帧前/背景区域分别进行颜色特征的建模,获得分割数据项;根据分割数据项,结合多种特征,建立时空平滑项;根据分割数据项和时空平滑项,加入高阶能量项;将高阶能量项近似为数据项和平滑项;使用图割算法完成分割。本发明在数据项和平滑项的基础上加入了一种基于SIFT特征的高阶能量约束来保证视频分割的全局一致性,解决了当视频对象是运动的且形状不规则、帧间光流存在明显干扰时,分割效果非常不理想的问题以及高阶能量项优化计算负载过高的问题。
-
公开(公告)号:CN114037684A
公开(公告)日:2022-02-11
申请号:CN202111316595.8
申请日:2021-11-08
Applicant: 南京信息工程大学
IPC: G06T7/00 , G06V10/40 , G06V10/764 , G06V10/80 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08 , G01D21/02
Abstract: 本发明公开了一种基于yo1ov5和注意力机制模型的疵点检测方法,包括:基于yo1ov5网络和注意力机制模型构建疵点检测模型;对导入的工业疵点图像进行预处理,将预处理图像导入疵点检测模型,得到形状不同的三个输出特征层;对形状不同的三个输出特征层进行预测,生成边界框并预测类别;对图像上疵点的类别和疵点的位置信息进行显示,得到疵点检测图像。本发明可以有效的提高模型对空间特征和通道特征的学习,通过检测头可以实现对不同大小的疵点进行检测,提高了对于大疵点的检测效果,从而提高检测效率,解决了当前工业疵点检测算法很难同时保证检测算法的准确率及实时性。
-
公开(公告)号:CN110390293A
公开(公告)日:2019-10-29
申请号:CN201910649351.8
申请日:2019-07-18
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于高阶能量约束的视频对象分割算法,包括以下步骤:将视频帧序列进行超像素分割;根据超像素分割结果,使用高斯混合模型,对预先给定的已标记帧前/背景区域分别进行颜色特征的建模,获得分割数据项;根据分割数据项,结合多种特征,建立时空平滑项;根据分割数据项和时空平滑项,加入高阶能量项;将高阶能量项近似为数据项和平滑项;使用图割算法完成分割。本发明在数据项和平滑项的基础上加入了一种基于SIFT特征的高阶能量约束来保证视频分割的全局一致性,解决了当视频对象是运动的且形状不规则、帧间光流存在明显干扰时,分割效果非常不理想的问题以及高阶能量项优化计算负载过高的问题。
-
公开(公告)号:CN117474797B
公开(公告)日:2024-03-19
申请号:CN202311832535.0
申请日:2023-12-28
Applicant: 南京信息工程大学
IPC: G06T5/70 , G06T5/50 , G06T5/60 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种多尺度互补学习的图像去噪方法及装置,方法包括:步骤1:图像预处理之后得到标准化的基层和细节层;步骤2:将细节层输入细节特征学习分支得到第一个图像细节特征;步骤3:将细节层输入噪声学习分支得到第二个图像细节特征;步骤4:融合两个分支学习得到的图像细节特征;步骤5:将最终的图像细节特征和基层相加得到去噪后的图像;步骤6:计算损失并迭代训练,重复步骤2至步骤5并保存最优去噪模型;步骤7:将测试图像输入保存好的去噪模型进行测试。当噪声水平越高时,去噪模型的去噪效果越好,使噪声的去除和细节的保留之间达到良好的平衡。同时只使用了细节层参与去噪模型训练,极大减少了计算量。
-
公开(公告)号:CN108322276A
公开(公告)日:2018-07-24
申请号:CN201810050534.3
申请日:2018-01-18
Applicant: 南京信息工程大学
IPC: H04B17/382 , H04B17/309
Abstract: 本发明公开了一种基于D-S证据理论的频谱感知准确率提升技术,首先根据认知用户的历史感知数据,计算认知用户在历史行为中的可信度值,从而剔除那些可信度低于一定阈值的认知用户选出具有代表性的认知用户参与频谱感知。根据历史数据筛选出来的认知用户,结合D-S证据理论方法,再次从代表性认知用户中选择更适合的认知用户参与频谱感知,从而可以判断当前信道的可用性。本发明能够有效地减少频谱感知过程中的能量消耗,同时有效地提高了频谱感知的准确率。
-
公开(公告)号:CN114494805B
公开(公告)日:2025-01-17
申请号:CN202111543339.2
申请日:2021-12-16
Applicant: 南京信息工程大学
IPC: G06V10/82 , G06V10/764 , G06V10/80 , G06V10/44 , G06N3/045 , G06N3/0464
Abstract: 本发明公开了图像处理技术领域的一种基于Resnet50结合注意力机制和特征金字塔的图像分类方法,包括以下步骤:S1、采集输入图片,并对图像进行数据预处理;S2、将预处理后的图像导入分类模型,输出三个不同卷积层的特征图;S3、对各特征图进行分别的分类预测,取可信度最大分类器,输出最终预测分类结果,本发明具有图像分类准确率高、提取质量高等优点。
-
公开(公告)号:CN118447256A
公开(公告)日:2024-08-06
申请号:CN202410903539.1
申请日:2024-07-08
Applicant: 南京信息工程大学
IPC: G06V10/26 , G06V10/764 , G06V10/82 , G06V20/70 , G06N3/045 , G06N3/0895 , G06N3/094 , G06V10/774
Abstract: 本发明公开了一种基于强弱一致性的半监督对抗互训练语义分割方法,包括以下步骤:(1)获取开源网站Pascal VOC2012数据集体并进行预处理;(2)构建基于改进的deeplabV3+差异特征一致性融合伪标签分支监督分割网络并进行训练,包括:快速增强网络和重度增广网络;(3)输出分割图;本发明使用互训练的思想构建了一个基于强弱一致性的对抗联合训练架构方法,用于半监督语义分割,不仅拥有很好的端对端训练,而且在训练中使用了互训练的方法,两个分支相互监督避免了确认偏差的影响,且特征对抗的思想更是强制让模型拥有更强的泛化能力,强弱一致性也让模型能够在图像包含较少有效信息的情况下有很好的性能。
-
公开(公告)号:CN117474797A
公开(公告)日:2024-01-30
申请号:CN202311832535.0
申请日:2023-12-28
Applicant: 南京信息工程大学
IPC: G06T5/70 , G06T5/50 , G06T5/60 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种多尺度互补学习的图像去噪方法及装置,方法包括:步骤1:图像预处理之后得到标准化的基层和细节层;步骤2:将细节层输入细节特征学习分支得到第一个图像细节特征;步骤3:将细节层输入噪声学习分支得到第二个图像细节特征;步骤4:融合两个分支学习得到的图像细节特征;步骤5:将最终的图像细节特征和基层相加得到去噪后的图像;步骤6:计算损失并迭代训练,重复步骤2至步骤5并保存最优去噪模型;步骤7:将测试图像输入保存好的去噪模型进行测试。当噪声水平越高时,去噪模型的去噪效果越好,使噪声的去除和细节的保留之间达到良好的平衡。同时只使用了细节层参与去噪模型训练,极大减少了计算量。
-
公开(公告)号:CN114494805A
公开(公告)日:2022-05-13
申请号:CN202111543339.2
申请日:2021-12-16
Applicant: 南京信息工程大学
IPC: G06V10/80 , G06V10/82 , G06V10/764 , G06N3/04 , G06K9/62
Abstract: 本发明公开了图像处理技术领域的一种基于Resnet50结合注意力机制和特征金字塔的图像分类方法,包括以下步骤:S1、采集输入图片,并对图像进行数据预处理;S2、将预处理后的图像导入分类模型,输出三个不同卷积层的特征图;S3、对各特征图进行分别的分类预测,取可信度最大分类器,输出最终预测分类结果,本发明具有图像分类准确率高、提取质量高等优点。
-
-
-
-
-
-
-
-
-