一种基于层次细粒度分类的图像分类方法

    公开(公告)号:CN116721294A

    公开(公告)日:2023-09-08

    申请号:CN202310689428.0

    申请日:2023-06-12

    Abstract: 本发明公开了一种基于层次细粒度分类的图像分类方法,涉及细粒度分类、深度学习技术等。本发明方法包括:对少量标注的样本标签进行处理,获取适用于YOLOv5算法的文本标签;建立基于YOLOv5算法的检测器,检测图像中的目标,剔除面积小于预设值的目标框以及重叠的目标框;以目标框为中心从图像中裁剪固定大小的子图像,子图像包含所识别目标的上下文关系,对子图像输入细粒度分类网络,提取子图像的大中小三种粒度的局部特征和全局特征,进行特征融合后进行细粒度类别分类。本发明实现更全面地利用关键信息和局部特征来提高分类性能,从而能更加准确地捕捉图像中的细节和差异,提高图像细类别的分类性能。

    一种基于全尺度跳跃连接U型结构的图像分割方法

    公开(公告)号:CN116958541A

    公开(公告)日:2023-10-27

    申请号:CN202310689398.3

    申请日:2023-06-12

    Abstract: 本发明公开了一种基于全尺度跳跃连接U型结构的图像分割方法,涉及图像分割、深度学习等。本发明方法包括:将医学图像进行块分割,将分割得到的块特征输入到基于的Swin Transformer模块的编码器中进行下采样,通过下采样的方式抽取全局信息。将下采样后的特征输入到基于的Swin Transformer模块的解码器中进行上采样,通过上采样将特征图的分辨率恢复到输入分辨率,同时通过全尺度跳跃连接将每一个下采样块的输出传送给解码器中的每一个上采样块进行合并拼接,最终输出像素级分割预测。本发明方法通过全尺度跳跃连接,使分割模型捕获了全尺度下的细粒度语义和粗粒度语义,再融合Swin Transformer结构,改善了卷积的归纳偏置问题,有效提高了医学影像的语义分割性能。

Patent Agency Ranking