-
公开(公告)号:CN114283315B
公开(公告)日:2024-08-16
申请号:CN202111565805.7
申请日:2021-12-17
Applicant: 安徽理工大学
IPC: G06V10/25 , G06V10/80 , G06V10/44 , G06V10/42 , G06V10/52 , G06V10/56 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06N3/048
Abstract: 本发明提供了一种基于交互式引导注意力和梯形金字塔融合的RGB‑D显著性目标检测方法,属于图像显著性检测技术,所述方法利用RGB和Depth图像实现输入场景的显著性目标检测。本发明的贡献主要在于通过从RGB和Depth图像之间存在的二义性角度出发,设计一种交互式引导的注意力机制指导RGB图像特征和Depth图像特征进行交叉融合有效消除跨模态数据之间的二义性问题。通过建立梯形金字塔特征融合网络进一步探索多尺度特征之间的联系和协作机制,利用多尺度的特征信息有效的提升模型检测的性能,并且可以兼顾高级语义信息和低级的细节信息,从到可以达到感知显著性目标的边缘细节和整体完整性。最后,利用多尺度特征聚合生成显著目标检测结果。
-
公开(公告)号:CN115578436A
公开(公告)日:2023-01-06
申请号:CN202211252277.4
申请日:2022-10-13
Applicant: 安徽理工大学
Abstract: 本发明提出一种基于多级特征并行交互融合的单目深度预测方法,尝试提出一种CNN与Transformer层级交互融合的方式,使用SwinTransformer和CNN不同分辨率特征图进行融合,以获得更好的编码器,获取更丰富的全局和局部特征信息,达到提取密集特征的效果。使用分层ResNet和SwinTransformer作为编码器,分别提取局部相邻信息特征与全局长范围上下文信息,通过层级ResNet网络与Transformer的融合,在编码器阶段获得丰富的局部与全局信息,避免因为重复的下采样而丢失过多的特征信息。此外,本发明构建了一个新的融合模块(FFM),在层级特征提取阶段,更好的促进卷积神经网络输出与Transformer输出高效融合,进一步获得密集的深度信息,得到高质量的深度图,用于三维重建、自动驾驶、智能机器人等领域。
-
公开(公告)号:CN114913344A
公开(公告)日:2022-08-16
申请号:CN202210019564.4
申请日:2022-01-07
Applicant: 安徽理工大学
Abstract: 本发明属于计算机视觉领域,提供了一种层次化多感受野网络的显著性目标检测算法,包括以下步骤:1)将ResNet‑50作为主干框架对RGB图像提取多尺度特征信息然后进行编码;2)利用层次化多感受野卷积机制优化多层次特征生成高质量特征;3)利用隐形关系特征融合机制将优化后的特征进行互补性融合,然后生成最终显著性图。与现有的技术相比,本发明层次化多感受野网络的显著性目标检测算法利用不同层次感受野的卷积操作优化多层次特征并进行隐形关系特征融合,多层次特征逐层优化生成高性能显著性图。
-
公开(公告)号:CN114693951A
公开(公告)日:2022-07-01
申请号:CN202210300694.5
申请日:2022-03-24
Applicant: 安徽理工大学
IPC: G06V10/46 , G06V10/80 , G06V10/774 , G06K9/62
Abstract: 本发明属于计算机视觉领域,公开了一种基于全局上下文信息探索的RGB‑D显著性目标检测方法,包括以下步骤:1)获取训练和测试该任务的RGB‑D数据集,并定义本发明的算法目标,并确定用于训练和测试算法的训练集和测试集;2)基于连续卷积层堆叠用来构建跨模态上下文特征模块提取特征信息;3)定义一叠连续的卷积层和多尺度特征的多尺度特征解码器(MFD)以及空间通道注意力;4)构建多尺度特征解码器,将这些多尺度特征融合到一个自上而下的聚合策略中,并生成显著性结果;5)采用二元交叉熵(BCE)来训练本发明的模型,这也是SOD任务中普遍存在的损失函数。计算出在不同的像素下的预测值和真实值之间的误差。
-
公开(公告)号:CN114332559B
公开(公告)日:2024-08-06
申请号:CN202111565872.9
申请日:2021-12-17
Applicant: 安徽理工大学
IPC: G06V10/774 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/084
Abstract: 本发明属于计算机视觉领域,提供了一种自适应跨模态融合机制和深度注意力网络的RGB‑D显著性目标检测方法,所述方法利用RGB和Depth图像实现输入场景的显著性目标检测。本发明的贡献主要在于利用Depth附加的视觉先验信息(边缘细节和空间分布信息)角度出发,设计一种自适应跨模态特征融合机制有效地融合RGB特征和Depth特征,实现Depth特征对于RGB特征的空间分布和边缘细节的曾强,该自适应跨模态特征融合机制利用深度图像的深度分布直方图判断适度图像质量从而实现高质量深度图像的选择,过滤掉低质量深度图像,进而建立深度显著性先验和背景先验的计算方式,实现RGB特征和Depth特征的高效互补的自适应跨模态特征融合方案。最后,整合多尺度融合特征,得到预测结果。
-
公开(公告)号:CN114863208A
公开(公告)日:2022-08-05
申请号:CN202210413768.6
申请日:2022-04-19
Applicant: 安徽理工大学
IPC: G06V10/774 , G06V10/82 , G06V10/80 , G06V10/77 , G06V10/46 , G06V10/44 , G06V10/42 , G06N3/04 , G06K9/62
Abstract: 本发明属于计算机视觉领域,提供了一种基于渐进收缩和循环交互网络的显著性目标检测算法,包括以下步骤:1)利用预训练好的ResNet‑50网络作为主干网络提取初始多层次特征;2)利用多尺度上下文注意力模块捕获局部和全局上下文注意力信息,然后通过聚合这些信息增加初始多层次特征中的显著性目标信息;3)利用相邻特征收缩与交互模块将优化后的多层次特征逐渐压缩和交互生成高质量特征表示;4)利用降维操作和Sigmoid函数将生成的高质量表示进行降维激活预测初始显著性图,并利用混合损失函数训练此模型。大量的在多个公开的数据集上的实验数据表明了,此发明具有高效性和优越性。
-
公开(公告)号:CN114332491A
公开(公告)日:2022-04-12
申请号:CN202111463853.5
申请日:2021-12-03
Applicant: 安徽理工大学
Abstract: 本发明属于显著性目标检测领域,提供了一种基于特征重构的显著性目标检测算法,包括以下步骤:1)首先输入原始RGB图像利用预训练好的ResNet‑50网络进行多层次特征提取;2)然后,使用残差特征重构模块,提取局部和全局上下文信息,聚合上下文信息增强特征中目标的显著性,优化多层次特征。3)随后,引入残差短连接聚合优化后的多层次特征交互多种信息生成具有丰富显著性目标信息的特征表示。4)最后,将特征表示进行降维并激活,使用多次监督策略进行模型训练。通过大量的与现存显著性目标检测方法相比较,本发明基于特征重构的显著性目标检测算法,通过利用精心设计的卷积、空洞卷积以及特征重构操作可以准确预测和分割的显著性目标。
-
公开(公告)号:CN114299305A
公开(公告)日:2022-04-08
申请号:CN202111654905.7
申请日:2021-12-30
Applicant: 安徽理工大学
Abstract: 本发明属于计算机视觉领域领域,提供了一种聚合密集和注意力多尺度特征的显著性目标检测算法,包括以下步骤:首先,利用预训练好的ResNet‑50网络作为特征编码器从输入图像中提取初始多层次特征;随后,初始多层次特征通过深层稠密特征探索模块通过平行集成卷积块和稠密连接充分地提取和利用多尺度上下文信息增强特征的多样性和相关性;之后,优化后的多层次特征输入多尺度通道注意力强化模块通过集成多视角注意力特征强化通道中显著性目标信息和压缩背景来生成高质量特征表示;最后,生成的高质量特征表示进行降维和激活,生成的初始显著性图利用混合损失函数进行深层监督训练。
-
公开(公告)号:CN114863208B
公开(公告)日:2024-08-09
申请号:CN202210413768.6
申请日:2022-04-19
Applicant: 安徽理工大学
IPC: G06V10/774 , G06V10/82 , G06V10/80 , G06V10/77 , G06V10/46 , G06V10/44 , G06V10/42 , G06N3/045 , G06N3/0464 , G06N3/09
Abstract: 本发明属于计算机视觉领域,提供了一种基于渐进收缩和循环交互网络的显著性目标检测算法,包括以下步骤:1)利用预训练好的ResNet‑50网络作为主干网络提取初始多层次特征;2)利用多尺度上下文注意力模块捕获局部和全局上下文注意力信息,然后通过聚合这些信息增加初始多层次特征中的显著性目标信息;3)利用相邻特征收缩与交互模块将优化后的多层次特征逐渐压缩和交互生成高质量特征表示;4)利用降维操作和Sigmoid函数将生成的高质量表示进行降维激活预测初始显著性图,并利用混合损失函数训练此模型。大量的在多个公开的数据集上的实验数据表明了,此发明具有高效性和优越性。
-
公开(公告)号:CN114119978B
公开(公告)日:2024-08-09
申请号:CN202111461687.5
申请日:2021-12-03
Applicant: 安徽理工大学
IPC: G06V10/26 , G06V10/46 , G06V10/764 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/048 , G06N3/09
Abstract: 本发明属于计算机视觉领域,提供了一种集成多源特征网络的显著性目标检测算法,包括以下步骤:1)利用ResNet‑50主干网络从RGB图像提取初始多层次特征;2)利用多尺度特征聚合模块充分提取多尺度特征,聚合优化多层次特征增加特征多样性;3)利用全局特征提取器从初始特征中提取更高层次语义信息;4)利用关联特征交互模块互补性融合交互多层次特征,生成最显著特征表示;5)利用深度监督模块将最显著特征表示降维激活生成显著性图并利用真值标签以端到端的方式进行训练监督。通过与现存的最先进的显著性目标检测算法相比,本发明集成多源特征网络的显著性目标检测算法具有很大的优势。
-
-
-
-
-
-
-
-
-