-
公开(公告)号:CN118314426A
公开(公告)日:2024-07-09
申请号:CN202410317295.9
申请日:2024-03-20
Applicant: 安徽理工大学
IPC: G06V10/80 , G06V10/764 , G06V10/774 , G06V10/82 , G06V20/64 , G06N3/0464
Abstract: 本发明属于计算机视觉领域,具体涉及一种基于伪点云增强和多阶段特征融合的多模态3D目标检测算法。该算法包括伪点云增强和多级特征融合模块、多阶段可变形交叉注意力对齐模块、重采样和多级特征融合模块。具体来说,基于伪点云增强和多阶段特征融合的多模态3D目标检测算法采用深度补全与映射矩阵,将图像数据映射成伪点云,用伪点云特征来对原始点云数据进行数据增强;体素化网络用于对原始点云数据进行预处理,稀疏卷积用来计算点云的特征,可变形交叉注意力(Deformable Cross Attention)机制用于对齐多个阶段的特征;使用重采样和多级特征融合策略,丰富特征信息以实现高效检测,有效的提升了检测的精度和模型的鲁棒性。
-
公开(公告)号:CN117523221A
公开(公告)日:2024-02-06
申请号:CN202311348228.5
申请日:2023-10-17
Applicant: 安徽理工大学
IPC: G06V10/44 , G06V10/774 , G06V10/82 , G06N3/0464 , G06V10/86
Abstract: 本发明涉及一种边缘引导增强的伪装目标检测,由于目前的伪装物体变的十分的复杂,背景与前景高度相似,伴随着弱边界,低对比度,边界损坏或者身体轮廓伪装,现有方法不能完全识别物体的结构和细节,因此现有算法检测伪装目标的能力有待提高。因此提出了边缘引导增强的伪装目标检测。包括主干网络用来提取特征,边缘增强块(EEB),边缘指导模块(EGM)以及跨级别融合模块(CLFM)。将主干网络提取的特征分别输入到边缘增强模块和边缘指导模块,边缘增强模块获得的边缘预测图输入到边缘指导模块,由边缘指导模块输出的特征输入到跨级别融合模块进行多尺度的特征融合。实验结果表明具有更高的边缘检测性能。
-
公开(公告)号:CN117475134A
公开(公告)日:2024-01-30
申请号:CN202311379391.8
申请日:2023-10-24
Applicant: 安徽理工大学
Abstract: 本发明属于计算机视觉领域,提供了基于多尺度跨层特征融合网络的伪装目标检测算法,包括以下步骤:1)利用BM(Boundary‑guidance Module)模块定位伪装对象的边界,由于伪装的物体在视觉上嵌入到它们的背景中,这使得伪装的物体和周围背景之间的边界不清晰,因此BM模块起到了很大的作用。2)利用MSAM(Multi‑scale Feature Aggregation Module)模块从单个卷积层捕获多尺度特征,MSAM利用不同大小的卷积核来自适应地提取不同尺度的特征。3)利用MIAB(Multi‑source Information Aggregation Block)多元信息融合模块来进一步增强高分辨率特征图中的结构信息。4)利用混合损失函数训练此模型,使用GT(Ground Truth)来监督每一层生成的预测图,并且逐步细化目标区域,用图中的P1作为最终的结果。
-
公开(公告)号:CN116546227A
公开(公告)日:2023-08-04
申请号:CN202310429584.3
申请日:2023-04-18
Applicant: 安徽理工大学
IPC: H04N19/91 , H04N19/467
Abstract: 本发明提出一种基于时变哈夫曼码表的插值图像可逆数据隐藏方法,主要应用于云平台信息传输中的安全性问题。具体为:首先将原始图像进行插值操作分为两部分,分别利用因果预测器及非因果预测器进行像素预测,得到预测误差映射;将预测误差值分类,根据类内元素数量得到各预测误差值的哈夫曼码;利用时间的易变性将类内序列置乱,从而修改哈夫曼码字的顺序,获得压缩码流。根据用户私钥和时变哈夫曼码可生成密钥,用来加密压缩码,生成加密流,得到加密图像;接着进行数据嵌入;最后提取标记图像中的数据并恢复原图像。本发明利用像素间相关性及时间易变性提高了数据嵌入的容量及安全性,满足了实际应用中的需求。
-
公开(公告)号:CN116485860A
公开(公告)日:2023-07-25
申请号:CN202310429798.0
申请日:2023-04-18
Applicant: 安徽理工大学
IPC: G06T7/50 , G06N3/0455 , G06N3/0464
Abstract: 本发明属于计算机视觉图像处理领域,提出了一种基于多尺度渐进交互和聚合交叉注意力特征的单目深度预测算法,包括以下步骤:在编码器中首先使用预训练后的ResNet‑50网络从输入的RGB图像中逐渐提取多尺度的特征,之后添加Transformer模块帮助解决卷积神经网络有限的感受野问题,指导提取编码器最终的深度特征图;其次,在解码器中,通过提出的查询注意模块渐进式地交互查询和利用来自多尺度ResNet‑50卷积模块提取的不同区域特征以及Transformer模块提取的全局上下文信息特征,做到充分增强和融合空间信息的多样性和相关性,逐渐查询细化边缘特征。本文提出的查询交叉注意模块(QAM)既能够充分地利用卷积神经网络对空间相关性建模的归纳偏差又能够使用Transformer对全局关系建模从而获得更细粒度和密集的深度特征表示,生成高质量的深度预测图。
-
公开(公告)号:CN115578436A
公开(公告)日:2023-01-06
申请号:CN202211252277.4
申请日:2022-10-13
Applicant: 安徽理工大学
Abstract: 本发明提出一种基于多级特征并行交互融合的单目深度预测方法,尝试提出一种CNN与Transformer层级交互融合的方式,使用SwinTransformer和CNN不同分辨率特征图进行融合,以获得更好的编码器,获取更丰富的全局和局部特征信息,达到提取密集特征的效果。使用分层ResNet和SwinTransformer作为编码器,分别提取局部相邻信息特征与全局长范围上下文信息,通过层级ResNet网络与Transformer的融合,在编码器阶段获得丰富的局部与全局信息,避免因为重复的下采样而丢失过多的特征信息。此外,本发明构建了一个新的融合模块(FFM),在层级特征提取阶段,更好的促进卷积神经网络输出与Transformer输出高效融合,进一步获得密集的深度信息,得到高质量的深度图,用于三维重建、自动驾驶、智能机器人等领域。
-
公开(公告)号:CN114913344A
公开(公告)日:2022-08-16
申请号:CN202210019564.4
申请日:2022-01-07
Applicant: 安徽理工大学
Abstract: 本发明属于计算机视觉领域,提供了一种层次化多感受野网络的显著性目标检测算法,包括以下步骤:1)将ResNet‑50作为主干框架对RGB图像提取多尺度特征信息然后进行编码;2)利用层次化多感受野卷积机制优化多层次特征生成高质量特征;3)利用隐形关系特征融合机制将优化后的特征进行互补性融合,然后生成最终显著性图。与现有的技术相比,本发明层次化多感受野网络的显著性目标检测算法利用不同层次感受野的卷积操作优化多层次特征并进行隐形关系特征融合,多层次特征逐层优化生成高性能显著性图。
-
公开(公告)号:CN114898356A
公开(公告)日:2022-08-12
申请号:CN202210536412.1
申请日:2022-05-12
Applicant: 安徽理工大学
Abstract: 本发明属于计算机视觉领域,提供了基于球体空间特征和多模态交叉融合网络的3D目标检测算法,包括以下步骤:1)利用体素质心下采样算法从原始点云数据中心选取关键点,然后以关键点为中心搜索邻近固定半径内的点;2)利用稀疏卷积对选取的每个球体中的点进行特征提取,得到空间组,再运用卷积操作得到空间特征;3)利用三层UNet网络对RGB图像进行多尺度特征提取,得到语义组,通过MLP将其扩展到与空间特征相同的维度,得到语义特征;4)使用交叉注意力机制融合空间特征与语义特征,融合后的特征再输入到检测头进行检测,并利用混合损失函数训练此模型。大量的在多个公开的数据集上的实验数据表明了,此发明具有高效性和优越性。
-
公开(公告)号:CN114299305B
公开(公告)日:2024-07-12
申请号:CN202111654905.7
申请日:2021-12-30
Applicant: 安徽理工大学
Abstract: 本发明属于计算机视觉领域领域,提供了一种聚合密集和注意力多尺度特征的显著性目标检测算法,包括以下步骤:首先,利用预训练好的ResNet‑50网络作为特征编码器从输入图像中提取初始多层次特征;随后,初始多层次特征通过深层稠密特征探索模块通过平行集成卷积块和稠密连接充分地提取和利用多尺度上下文信息增强特征的多样性和相关性;之后,优化后的多层次特征输入多尺度通道注意力强化模块通过集成多视角注意力特征强化通道中显著性目标信息和压缩背景来生成高质量特征表示;最后,生成的高质量特征表示进行降维和激活,生成的初始显著性图利用混合损失函数进行深层监督训练。
-
公开(公告)号:CN118314427A
公开(公告)日:2024-07-09
申请号:CN202410417600.1
申请日:2024-04-09
Applicant: 安徽理工大学
IPC: G06V10/80 , G06V10/82 , G06V10/764 , G06V20/70
Abstract: 本发明涉及一种基于前景和背景特征融合细化的伪装目标检测方法。包括如下步骤:以PVTv2为骨干网络提取伪装物体图像的多个层次的特征;将最高层特征通过分层特征定位模块来探索重要的位置信息以实现伪装目标的初步定位;利用双分支融合模块同时利用图像中前景和背景信息有助于精确的识别伪装目标;利用残差细化模块有效的融合不同层次的特征提升检测的性能;利用加权二值交叉熵和加权IOU损失共同来训练模型。进一步提高了计算机视觉中伪装目标检测在不同场景下检测的效果。
-
-
-
-
-
-
-
-
-