小样本图像分类的方法
    81.
    发明授权

    公开(公告)号:CN113486202B

    公开(公告)日:2023-08-04

    申请号:CN202110742932.3

    申请日:2021-07-01

    Abstract: 本发明公开了小样本图像分类的方法,涉及机器学习技术领域,解决了分类模型中使用少量样本不能达到较高分类准确率的技术问题,其技术方案要点是在训练和测试时保持高度的一致性,都以K类各Z张图像以及待分类图像作为模型的一次输入,有利于准确率的提升。同时,在对图像进行特征提取后,使用多尺度思想,分别考虑不同尺度下已知类别的图像特征与待分类图像特征的关系。不同的尺度有利于对图像中不同大小物体的相似度判断;同尺度已知类别的图像特征与待分类图像特征一起输入分类器能够综合考虑各类别间的亲疏关系,更好地输出各类别与待分类图像的相似度,提高了小样本图像分类的准确率。

    图像特征提取方法、装置及水源图像分类方法、装置

    公开(公告)号:CN108694415B

    公开(公告)日:2022-08-12

    申请号:CN201810464977.7

    申请日:2018-05-16

    Applicant: 南京大学

    Abstract: 本发明提出一种图像特征提取方法,包括:将原图像进行颜色空间分解,获取所述原图像的H通道图像、S通道图像以及V通道图像;对H通道图像、S通道图像以及V通道图像分别进行图像变换,生成每个颜色通道对应的频率域图像;对于每个颜色通道的频率域图像,分别以所述频率域图像中心为圆心,按预设半径划分M个同心圆,再根据预设角度划分N个等角扇形,获取若干个扇形区域,其中M为大于1的整数,N为大于0的整数;计算每个扇形区域的均值和方差;统计每个颜色通道图像的所述均值和方差将作为原图像的图像特征。本发明在图像分类时考虑图像的颜色特性,同时有效地提取图像纹理特征,能对干净水源图像和污染水源图像进行更准确的分类。

    一种基于压缩感知原理的卷积神经网络压缩方法及解压缩方法

    公开(公告)号:CN107832837B

    公开(公告)日:2021-09-28

    申请号:CN201711215956.3

    申请日:2017-11-28

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于压缩感知原理的卷积神经网络压缩方法及解压缩方法,其中压缩方法包括:预处理步骤、将卷积神经网络中的每一层的权值预处理为一系列矩阵;压缩步骤、将预处理步骤得到的预处理结果进行压缩处理得出压缩后的权值;训练步骤、对压缩后的权值进行训练;编码步骤、对训练步骤训练后的已压缩权值进行编码;模型生成步骤、根据经编码步骤得到的编码结果生成压缩后的卷积神经网络模型文件。本发明基于压缩感知原理的卷积神经网络压缩方法,相比其他方法,会比现在较为流行的直接剪枝量化方法有更高的压缩率,而且可以通过在频域中保留低频信息来防止过多的信息损失。

    用于实例分割的数据增强方法

    公开(公告)号:CN112907605A

    公开(公告)日:2021-06-04

    申请号:CN202110305495.9

    申请日:2021-03-19

    Applicant: 南京大学

    Inventor: 路通 许聪 王文海

    Abstract: 本发明公开了一种用于实例分割的数据增强方法,涉及实例分割技术领域,解决了实例分割模型的实例分割效果较差的技术问题,其技术方案要点是通过非感兴趣区域去除算法对所述第一图片的非感兴趣区域进行去除,得到非感兴趣区域去除图片,再根据全局自然平均亮度对所述第二图片中的非感兴趣区域进行亮度填充,得到增强图片,将该增强图片加入到原来的训练集训练实例分割模型,从而得到实例分割效果提高、泛化性能提升的实例分割模型。

    一种基于上下边界提取的自然场景下文字检测方法

    公开(公告)号:CN112861860A

    公开(公告)日:2021-05-28

    申请号:CN202110265373.1

    申请日:2021-03-11

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于上下边界提取的自然场景下文字检测方法,涉及计算机视觉文字检测和图像分割领域。具体包括:步骤1,通过卷积神经网络模型提取图像的特征图,并通过多尺度特征金字塔模型对特征图进行增强;步骤2,通过语义分割模型预测文字的中心区域,上边界区域,下边界区域和文字的整体区域;步骤3,通过广度优先搜索将中心区域逐步扩展至整体区域,同时通过对上下边界区域进行滤波操作得到文字的形式化上下边界线;步骤4,组合文字的中心区域、整体区域以及上下边界线得到最终的文字检测结果。优点在于能够提取图像中文字的上下边界并定位文字区域,能够进行自然场景下的图像文字检测。

    一种自然场景文字检测的方法

    公开(公告)号:CN107480648B

    公开(公告)日:2020-03-27

    申请号:CN201710728404.6

    申请日:2017-08-23

    Abstract: 本发明公开了一种用于自然场景文字检测的方法,包括以下步骤:步骤1,输入一张待检测文字的图片;步骤2,提取输入图片的极值区域,并通过极值区域的面积、周长、欧拉数和色彩分布来过滤掉多余的极值区域,得到字符候选区域;步骤3,提取每个字符候选区域的边缘图像,并计算边缘图像的COLD特征;步骤4,将字符候选区域的COLD特征输入预先训练好的随机森林分类器,判断该字符候选区域是不是真正的字符区域;步骤5,将字符区域合并,得到最终的文字区域,完成场景文字检测任务。本发明检测方法具有很强的鲁棒性,检测效率高,可以快速完成文字检测。

Patent Agency Ranking