-
公开(公告)号:CN114332559B
公开(公告)日:2024-08-06
申请号:CN202111565872.9
申请日:2021-12-17
Applicant: 安徽理工大学
IPC: G06V10/774 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/084
Abstract: 本发明属于计算机视觉领域,提供了一种自适应跨模态融合机制和深度注意力网络的RGB‑D显著性目标检测方法,所述方法利用RGB和Depth图像实现输入场景的显著性目标检测。本发明的贡献主要在于利用Depth附加的视觉先验信息(边缘细节和空间分布信息)角度出发,设计一种自适应跨模态特征融合机制有效地融合RGB特征和Depth特征,实现Depth特征对于RGB特征的空间分布和边缘细节的曾强,该自适应跨模态特征融合机制利用深度图像的深度分布直方图判断适度图像质量从而实现高质量深度图像的选择,过滤掉低质量深度图像,进而建立深度显著性先验和背景先验的计算方式,实现RGB特征和Depth特征的高效互补的自适应跨模态特征融合方案。最后,整合多尺度融合特征,得到预测结果。
-
公开(公告)号:CN116665027A
公开(公告)日:2023-08-29
申请号:CN202310429064.2
申请日:2023-04-21
Applicant: 安徽理工大学
Abstract: 本发明属于信息安全领域,提供了一种高鲁棒性的图像篡改检测方法,包括以下步骤:1)利用空洞卷积来获得多尺度特征提取,使用Concat可以得到全局特征表示,既可防止多次卷积后丢失浅层特征,又能得到更大的感受野,提高小目标篡改检测的效果。2)利用BayarConv进行噪声提取,该噪声器提取方法优于SRM滤波器,Bayarconv是为了增强给定图像中操纵区域和真实区域之间的噪声不一致性而开发的。3)利用残差块、批归一化和激活函数来捕获空间特征,该构造是一个常规的编码器,主要目的是与语义特征进行交叉融合。4)使用交叉注意力机制融合空间特征与语义特征,融合后的特征再输入到上采样层和卷积层进行检测,并利用混合损失函数训练此模型。本文提出的交叉注意力机制在大量的在多个公开的数据集上的实验数据表明此发明不仅可以精确的预测篡改位置还可以更准确的识别篡改的类型。
-
公开(公告)号:CN116433917A
公开(公告)日:2023-07-14
申请号:CN202310401131.X
申请日:2023-04-15
Applicant: 安徽理工大学
Abstract: 本发明涉及一种基于视觉感知机制的伪装目标检测方法。包括如下步骤:提取伪装物体图像的多个级别的特征;融合多个级别的特征,得到第一阶段的预测结果;对伪装物体中提取的特征和第一阶段预测结果进行特征提取;将提取的特征送到分层混合比例交互模块,得到第二阶段的预测结果;通过自我注意力细化模块对第二阶段预测的结果进行细化;通过X形细化模块进一步优化对等层的特征,取得精确的检测结果。解决了计算机视觉中伪装目标检测的问题,在不同场景下具有有效性和实用性。
-
公开(公告)号:CN116433904A
公开(公告)日:2023-07-14
申请号:CN202310347813.7
申请日:2023-03-31
Applicant: 安徽理工大学
IPC: G06V10/26 , G06V20/70 , G06V10/80 , G06V10/774 , G06V10/82 , G06V10/40 , G06N3/0455 , G06N3/045 , G06N3/048 , G06N3/084
Abstract: 本发明属于计算机视觉领域,提供了一种基于形状感知的跨模态RGB‑D语义分割方法,包括以下步骤:1)获取训练和测试该任务的RGB‑D数据集,并定义本发明的算法目标;2)利用深度学习技术,构建基于形状感知和像素卷积并通过双编码器‑解码器结构构建RGB‑D语义分割网络模型;3)构建一个跨模态特征融合网络用于生成多模态特征;4)构通过交叉融合方法,融合跨模态特征,以增强多模态特征的高级语义信息;5)DeepLabV3+的解码器中,将编码器的输出上采样,使分辨率和低层级的feature一致。将特征层连接进行一次3×3的卷积,在经过sigmoid函数激活,得到预测的语义图Pest;6)预测的显著图Pest与人工标注的语义分割图PGT计算损失;7)对测试数据集进行测试,生成显著图Ptest,并使用评价指标进行性能评估。
-
公开(公告)号:CN115639802A
公开(公告)日:2023-01-24
申请号:CN202211252267.0
申请日:2022-10-13
Applicant: 安徽理工大学
IPC: G05B23/02
Abstract: 本发明公开了一种基于案例推理的故障诊断专家系统,提供一种故障诊断方法,该故障诊断方法可以根据故障现象、故障原因等判断9种矿井辅运设备的故障类型,并提供故障解决方案。第一步要设计故障案例库,收集案例并进行特征化。第二步通过灰色关联分析法衡量案例之间的相似度,将检索到的相似度最大的案例作为新案例最匹配的情况,设计了基于案例规则的决策树推理,构建针对每种设备的故障诊断决策树,且提供解决方案,有效地为辅运设备故障诊断从业人员提供专家经验。
-
公开(公告)号:CN114863208A
公开(公告)日:2022-08-05
申请号:CN202210413768.6
申请日:2022-04-19
Applicant: 安徽理工大学
IPC: G06V10/774 , G06V10/82 , G06V10/80 , G06V10/77 , G06V10/46 , G06V10/44 , G06V10/42 , G06N3/04 , G06K9/62
Abstract: 本发明属于计算机视觉领域,提供了一种基于渐进收缩和循环交互网络的显著性目标检测算法,包括以下步骤:1)利用预训练好的ResNet‑50网络作为主干网络提取初始多层次特征;2)利用多尺度上下文注意力模块捕获局部和全局上下文注意力信息,然后通过聚合这些信息增加初始多层次特征中的显著性目标信息;3)利用相邻特征收缩与交互模块将优化后的多层次特征逐渐压缩和交互生成高质量特征表示;4)利用降维操作和Sigmoid函数将生成的高质量表示进行降维激活预测初始显著性图,并利用混合损失函数训练此模型。大量的在多个公开的数据集上的实验数据表明了,此发明具有高效性和优越性。
-
公开(公告)号:CN114529740A
公开(公告)日:2022-05-24
申请号:CN202210029292.6
申请日:2022-01-07
Applicant: 安徽理工大学
Abstract: 本发明属于计算机视觉领域,提供了基于边缘指导和多层次特征动态聚合的显著性目标检测方法,包括以下步骤:1)利用VGG‑16主干框架对RGB图像进行初始多层次特征提取并进行编码;2)利用多层次特征动态聚合模块强化多层次特征,生成初始显著性图;3)利用边缘预测模块从主干网络中低层次的特征生成高质量边缘信息图;4)初始显著性图与边缘信息图进行高效融合增强显著性目标的边缘信息,生成高性能最终显著性图。与现有的技术相比,本发明基于边缘指导和多层次特征动态聚合的显著性目标检测方法通过集成两个模块极大提升优化多层次特征的表达能力,进一步提升显著性图的质量。
-
公开(公告)号:CN114332491A
公开(公告)日:2022-04-12
申请号:CN202111463853.5
申请日:2021-12-03
Applicant: 安徽理工大学
Abstract: 本发明属于显著性目标检测领域,提供了一种基于特征重构的显著性目标检测算法,包括以下步骤:1)首先输入原始RGB图像利用预训练好的ResNet‑50网络进行多层次特征提取;2)然后,使用残差特征重构模块,提取局部和全局上下文信息,聚合上下文信息增强特征中目标的显著性,优化多层次特征。3)随后,引入残差短连接聚合优化后的多层次特征交互多种信息生成具有丰富显著性目标信息的特征表示。4)最后,将特征表示进行降维并激活,使用多次监督策略进行模型训练。通过大量的与现存显著性目标检测方法相比较,本发明基于特征重构的显著性目标检测算法,通过利用精心设计的卷积、空洞卷积以及特征重构操作可以准确预测和分割的显著性目标。
-
公开(公告)号:CN114299305A
公开(公告)日:2022-04-08
申请号:CN202111654905.7
申请日:2021-12-30
Applicant: 安徽理工大学
Abstract: 本发明属于计算机视觉领域领域,提供了一种聚合密集和注意力多尺度特征的显著性目标检测算法,包括以下步骤:首先,利用预训练好的ResNet‑50网络作为特征编码器从输入图像中提取初始多层次特征;随后,初始多层次特征通过深层稠密特征探索模块通过平行集成卷积块和稠密连接充分地提取和利用多尺度上下文信息增强特征的多样性和相关性;之后,优化后的多层次特征输入多尺度通道注意力强化模块通过集成多视角注意力特征强化通道中显著性目标信息和压缩背景来生成高质量特征表示;最后,生成的高质量特征表示进行降维和激活,生成的初始显著性图利用混合损失函数进行深层监督训练。
-
公开(公告)号:CN114283315B
公开(公告)日:2024-08-16
申请号:CN202111565805.7
申请日:2021-12-17
Applicant: 安徽理工大学
IPC: G06V10/25 , G06V10/80 , G06V10/44 , G06V10/42 , G06V10/52 , G06V10/56 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06N3/048
Abstract: 本发明提供了一种基于交互式引导注意力和梯形金字塔融合的RGB‑D显著性目标检测方法,属于图像显著性检测技术,所述方法利用RGB和Depth图像实现输入场景的显著性目标检测。本发明的贡献主要在于通过从RGB和Depth图像之间存在的二义性角度出发,设计一种交互式引导的注意力机制指导RGB图像特征和Depth图像特征进行交叉融合有效消除跨模态数据之间的二义性问题。通过建立梯形金字塔特征融合网络进一步探索多尺度特征之间的联系和协作机制,利用多尺度的特征信息有效的提升模型检测的性能,并且可以兼顾高级语义信息和低级的细节信息,从到可以达到感知显著性目标的边缘细节和整体完整性。最后,利用多尺度特征聚合生成显著目标检测结果。
-
-
-
-
-
-
-
-
-