用于图像阴影检测的CNN模型生成方法、图像阴影检测方法

    公开(公告)号:CN118864881A

    公开(公告)日:2024-10-29

    申请号:CN202410836611.3

    申请日:2024-06-26

    Applicant: 安徽大学

    Abstract: 本申请涉及一种用于图像阴影检测的CNN模型生成方法、图像阴影检测方法,该CNN模型生成方法包括:将具有阴影的图像样本作为CNN模型的输入,以CNN模型能够检测图像样本中的阴影为目标对CNN模型进行训练,生成用于图像阴影检测的CNN模型;其中,CNN模型包括特征提取模块、子路径方向激励模块和交互特征空间解码器;特征提取模块依次连接的n(n≥2)个特征提取层,n个特征提取层被配置为对CNN模型的输入进行特征提取;子路径方向激励模块被配置为对第n个特征提取层的输出进行方向信息提取;交互特征空间解码器被配置为对除第n个特征提取层之外的所有特征提取层的输出以及子路径方向激励模块的输出进行解码,交互特征空间解码器的输出为CNN模型的输出。解决了现有CNN模型生成方法所生成的CNN模型的阴影检测准确度较低的问题。

    一种基于深度学习的自然图像抠图方法及抠图装置

    公开(公告)号:CN114373109B

    公开(公告)日:2024-03-05

    申请号:CN202210045761.3

    申请日:2022-01-16

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于深度学习的自然图像抠图方法及抠图装置。所述方法包括:设计四通道的图像输入;采用预先训练好的预训练模型提取图像输入的特征图;在第一阶段内:设定基于深度学习的网络模型一,针对特征图得到粗略透明度遮罩;在第二阶段内:将特征图随机取多个区域,并将这些区域中对应的粗略透明度遮罩作为第五通道添加到图像输入中;在当前的图像输入下,一方面采用基于深度学习的网络模型二,得到精细透明度遮罩,另一方面求解精细透明度遮罩的困难难度;对一个图像测试集中的所有待抠图的自然图像进行测试。本发明在技术上解决了未知区域较大图片难以抠图以及网络参数过多无法在内存较小的设备上抠图的问题,并在公开自然图像抠图数据集上取得了较好的结果。

    基于知识蒸馏的视频人体姿态估计方法

    公开(公告)号:CN117636390A

    公开(公告)日:2024-03-01

    申请号:CN202311564526.8

    申请日:2023-11-22

    Applicant: 安徽大学

    Abstract: 本发明公开了基于知识蒸馏的视频人体姿态估计方法,包括以下步骤:构建用于视频人体姿态估计的教师网络;构建用于视频人体姿态估计的学生网络;结合教师网络输出和学生网络输出计算知识蒸馏损失;将知识蒸馏损失添加到整体损失中优化学生网络模型;从优化后的学生网络中得到预测的结果。本发明的优点在于将知识蒸馏技术应用于视频人体姿态估计,利用专门用于视频人体姿态估计的教师网络指导学生网络学习,提升了学生网络预测结果的准确性,可适用于基于视频的人体姿态估计问题。

    半监督RGB-D图像镜面检测方法、存储介质及计算机设备

    公开(公告)号:CN117237343B

    公开(公告)日:2024-01-30

    申请号:CN202311498290.2

    申请日:2023-11-13

    Applicant: 安徽大学

    Abstract: 本发明公开了一种半监督RGB‑D图像镜面检测方法,包括以下步骤:S1、有标签图像预热三分支学生网络,学生网络提取RGB图像特征和Depth图像特征,融合形成融合特征;S2、将融合特征、RGB图像特征和Depth图像特征送入三分支解码,获得预测图并利用真值监督;S3、利用教师网络获得无标签图像的伪标签;S4、无标签图像与有标签图像混合获得混合图像;S5、混合图像与有标签图像送入学生网络进行训练;S6、将上述训练得到的最优参数加载进模型,将RGB‑D镜面检测数据集送入模型,得到对应图像的预测结果图,完成RGB‑D图像的镜面检测。本发明减少了(56)对比文件CN 113298154 A,2021.08.24刘政怡 等.基于多模态特征融合监督的RGB-D图像显著性检测《.电子与信息学报》.2020,第42卷(第4期),997-1004.Zhengyi Liu et al..Scribble-Supervised RGB-T Salient ObjectDetection《.https://arxiv.org/abs/2303.09733》.2023,全文.Vasilis Kontonis et al..SLaM:Student-Label Mixing for Semi-SupervisedKnowledge Distillation《.https://arxiv.org/abs/2302.03806v1》.2023,全文.

    一种基于多模态数据增强的光场图像显著物体检测方法

    公开(公告)号:CN117437432A

    公开(公告)日:2024-01-23

    申请号:CN202311499181.2

    申请日:2023-11-08

    Applicant: 安徽大学

    Abstract: 本发明涉及图像处理领域,具体涉及一种基于多模态数据增强的光场图像显著物体检测方法,包括:生成与全聚焦图像相同大小的网格掩码图,在网格掩码图中随机选择若干区域将该区域的值设为1,其他区域的值设为0;根据网格掩码图,利用全聚焦图像对多焦图像进行替换增强,产生增强的多焦图像;利用物体检测模型对增强的多焦图像和全聚焦图像进行训练学习,利用完成训练的物体检测模型检测光场图像中的显著物体。本发明可以有效地处理多焦图像的冗余和不准确性,从而提取出更可靠的特征,提高模型的检测效果;即使在测试样本的多焦图像局部信息不准确的情况下,本发明提供的方法依然能精准检测显著物体,从而提高模型的鲁棒性。

    基于红外信息的低光图像增强方法

    公开(公告)号:CN110889813B

    公开(公告)日:2023-11-24

    申请号:CN201911125919.2

    申请日:2019-11-15

    Applicant: 安徽大学

    Abstract: 为了克服背景技术的不足,本发明提出一种端到端的两阶段的神经网络模型来融合低光和红外信息增强图像,以到达增强低光图片的目的。首先,我们发现低光图片,由于光线较低造成局部信息丢失,单纯的增强低光图片,无法补充丢失的信息。受此问题的启发,我们考虑结合低光下红外图像,两个状态下的信息相互补充。整个模型中,我们在第一阶段对图像像素不为零区域,进行亮度和对比度提升。在网络的第二部分运用前景关注模块,重建缺失区域的图像,以此最终获得完整的亮图像。有益的技术效果:相比其他算法,本发明的算法引入了红外信息,在局部低光的情况下,恢复出了更多的细节,增强的图像整体更加的自然,且算法能处理更暗的图像。

    一种估计三维人体姿态及手部信息的方法

    公开(公告)号:CN109636831B

    公开(公告)日:2023-08-04

    申请号:CN201811557430.8

    申请日:2018-12-19

    Applicant: 安徽大学

    Abstract: 本发明为一种估计三维人体姿态及手部信息的方法,实现了一种新的以彩色深度相机单帧数据来自动准确的同时估计人体和手部的姿态以及人体实际体形的独特方法。首先将深度相机的关节预测与深度学习从彩色图预测关节的方法结合,同时获取人体的头部的转向解决现有技术不能匹配头部姿态的问题。同时,在人体估计中同时还原人手的姿态,使人体结果更形象具体,使用深度学习的方法从彩色图预测出手的3D姿态,然后使用3D人体关节拟合能量模型来完成人体姿态与最新的参数化人体模型SMPL+H的拟合。最后将获取的人体表面点云与拟合的模型进行配准提升人体形状估计的精确程度。籍此估计出一个准确的包含手部真实姿态的三维人体模型。

    一种基于局部变换一致的非刚性点集配准方法

    公开(公告)号:CN110874849A

    公开(公告)日:2020-03-10

    申请号:CN201911088118.3

    申请日:2019-11-08

    Applicant: 安徽大学

    Abstract: 本发明提供一种基于局部变换一致的非刚性点集配准方法,用以解决变形较大的非刚性物体,在配准过程中关节点周围出现的配准结果不理想的问题。为解决该问题,基于非刚性变换相邻节点之间的变换是比较一致的思想,在配准过程中通过计算每一个点的空间变换分别与其K个相邻点的空间变换的差异,令差异最小化实现对非刚性变换的局部约束,保证点集在配准过程中保持着局部结构,提高了关节点周围配准的效果。本发明在一些数据集上取得了较好的配准效果。

    基于自引导推理的弱监督图像语义分割方法

    公开(公告)号:CN110853072A

    公开(公告)日:2020-02-28

    申请号:CN201911087472.4

    申请日:2019-11-08

    Applicant: 安徽大学

    Abstract: 本发明提供基于自引导推理的弱监督图像语义分割方法,用来解决现有图像级标签监督下弱监督学习方法无法生成精确的语义分割图和训练过程复杂化的问题。为了解决这个问题,本发明基于同一对象的语义标签具有空间连续性提出了自引导推理层和自引导推理模块。本发明在技术上克服了现有弱监督语义分割技术无法获得精确分割效果和训练过程繁琐的问题,有效地提高了图像语义分割的准确率。

    一种基于卷积神经网络的同类前景图像集分割方法

    公开(公告)号:CN109712165A

    公开(公告)日:2019-05-03

    申请号:CN201811634200.7

    申请日:2018-12-29

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于卷积神经网络的同类前景图像集分割方法,包括了以下步骤:步骤1,生成样本分割掩码;步骤2,构建训练数据集;步骤3,学习分割网络模型;步骤4,基于分割网络模型分割同类图像集中的其余图像;步骤5,再分割。通过上述方式,本发明能够利用待分割图像集所包含的图像之间强相关性,仅需要少量交互就可以将同类图像集中的前景分割出来。

Patent Agency Ranking