一种基于密集特征提取与轻量级网络的多类商品目标检测方法

    公开(公告)号:CN114998609B

    公开(公告)日:2024-06-25

    申请号:CN202210544450.1

    申请日:2022-05-18

    Abstract: 本发明提出了一种基于密集特征提取与轻量级网络的多类商品目标检测方法,本方法主要应用于多类商品目标检测中,包括:收集主流购物APP上的商品图片,将商品分类,进行人工标注,划分为训练集和验证集;使用数据增强Cutout和Mixup操作解决数据不纯、重复等问题,扩充数据集;利用MobileNetV2网络提取多层次局部特征,利用Swin Transformer获取全局特征,并将多层次局部特征嵌入到Transformer结构中进行融合,最后对损失函数优化,将模型应用到多类密集的商品检测中。本发明可以对多种不同大小商品目标进行快速精准的分类和定位,同时整体网络模型的参数对比同类目标检测内存占用小、推断速度快、性能好、参数小,可以应用于移动端和嵌入设备,解决实际生活中问题。

    聚合密集和注意力多尺度特征的显著性目标检测算法

    公开(公告)号:CN114299305B

    公开(公告)日:2024-07-12

    申请号:CN202111654905.7

    申请日:2021-12-30

    Abstract: 本发明属于计算机视觉领域领域,提供了一种聚合密集和注意力多尺度特征的显著性目标检测算法,包括以下步骤:首先,利用预训练好的ResNet‑50网络作为特征编码器从输入图像中提取初始多层次特征;随后,初始多层次特征通过深层稠密特征探索模块通过平行集成卷积块和稠密连接充分地提取和利用多尺度上下文信息增强特征的多样性和相关性;之后,优化后的多层次特征输入多尺度通道注意力强化模块通过集成多视角注意力特征强化通道中显著性目标信息和压缩背景来生成高质量特征表示;最后,生成的高质量特征表示进行降维和激活,生成的初始显著性图利用混合损失函数进行深层监督训练。

    一种基于跨模态双向互补网络的RGB-D显著性目标检测方法

    公开(公告)号:CN114693953A

    公开(公告)日:2022-07-01

    申请号:CN202210308537.9

    申请日:2022-03-24

    Abstract: 本发明提供一种基于跨模态双向互补网络的RGB‑D显著性目标检测方法,属于图像显著性检测技术,所述方法利用RGB和depth图像的多模态数据,提取跨模态的特征用于推理输入场景的显著性目标或者区域。本发明的贡献主要在于通过从RGB和depth的鲁棒性和抗干扰性的角度出发,设计一种跨模态特征双向互补充机制。该机制利用depth特征优化RGB特征,并通过循环的方式将优化后的RGB特征用于增强depth特征。通过提出的跨模态特征双向互补充机制可以有效地处理RGB图像所遭遇的挑战性场景(低对比度,复杂背景,多目标等),并能够解决低质量深度图带来的负面影响。最后,利用深层特征指导策略集成多尺度特征,生成显著性结果。

    一种基于多尺度渐进交互和聚合交叉注意力特征的单目深度预测算法

    公开(公告)号:CN116485860A

    公开(公告)日:2023-07-25

    申请号:CN202310429798.0

    申请日:2023-04-18

    Abstract: 本发明属于计算机视觉图像处理领域,提出了一种基于多尺度渐进交互和聚合交叉注意力特征的单目深度预测算法,包括以下步骤:在编码器中首先使用预训练后的ResNet‑50网络从输入的RGB图像中逐渐提取多尺度的特征,之后添加Transformer模块帮助解决卷积神经网络有限的感受野问题,指导提取编码器最终的深度特征图;其次,在解码器中,通过提出的查询注意模块渐进式地交互查询和利用来自多尺度ResNet‑50卷积模块提取的不同区域特征以及Transformer模块提取的全局上下文信息特征,做到充分增强和融合空间信息的多样性和相关性,逐渐查询细化边缘特征。本文提出的查询交叉注意模块(QAM)既能够充分地利用卷积神经网络对空间相关性建模的归纳偏差又能够使用Transformer对全局关系建模从而获得更细粒度和密集的深度特征表示,生成高质量的深度预测图。

    一种基于多级特征并行交互融合的单目深度预测方法

    公开(公告)号:CN115578436A

    公开(公告)日:2023-01-06

    申请号:CN202211252277.4

    申请日:2022-10-13

    Abstract: 本发明提出一种基于多级特征并行交互融合的单目深度预测方法,尝试提出一种CNN与Transformer层级交互融合的方式,使用SwinTransformer和CNN不同分辨率特征图进行融合,以获得更好的编码器,获取更丰富的全局和局部特征信息,达到提取密集特征的效果。使用分层ResNet和SwinTransformer作为编码器,分别提取局部相邻信息特征与全局长范围上下文信息,通过层级ResNet网络与Transformer的融合,在编码器阶段获得丰富的局部与全局信息,避免因为重复的下采样而丢失过多的特征信息。此外,本发明构建了一个新的融合模块(FFM),在层级特征提取阶段,更好的促进卷积神经网络输出与Transformer输出高效融合,进一步获得密集的深度信息,得到高质量的深度图,用于三维重建、自动驾驶、智能机器人等领域。

    层次化多感受野网络的显著性目标检测算法

    公开(公告)号:CN114913344A

    公开(公告)日:2022-08-16

    申请号:CN202210019564.4

    申请日:2022-01-07

    Abstract: 本发明属于计算机视觉领域,提供了一种层次化多感受野网络的显著性目标检测算法,包括以下步骤:1)将ResNet‑50作为主干框架对RGB图像提取多尺度特征信息然后进行编码;2)利用层次化多感受野卷积机制优化多层次特征生成高质量特征;3)利用隐形关系特征融合机制将优化后的特征进行互补性融合,然后生成最终显著性图。与现有的技术相比,本发明层次化多感受野网络的显著性目标检测算法利用不同层次感受野的卷积操作优化多层次特征并进行隐形关系特征融合,多层次特征逐层优化生成高性能显著性图。

    一种基于二维混沌映射和全位面探索的可逆信息隐藏方法

    公开(公告)号:CN116455547A

    公开(公告)日:2023-07-18

    申请号:CN202310178658.0

    申请日:2023-02-28

    Abstract: 发明名称:一种基于二维混沌映射和全位面探索的可逆信息隐藏方法。摘要:本发明提出了一种基于二维混沌映射和全位面探索的可逆信息隐藏方法。具体来说,内容所有者提供封面图像,并使用混沌系统生成混沌序列进行块间置换和块内扩散。与混沌相结合的特殊加密方法不仅保留了块内像素的相关性,而且还提供了极高的安全性,FBPS技术可以应用于检测所有平滑的位平面,但不限于连续的MSBs。对于数据嵌入,用'0'和'1'来记录所有光滑和粗糙的位平面,以达到彻底的压缩。本发明对于原始载体图像的像素间相关性特征做到了充分的利用,在保证安全性和可逆性的前提下预留出较大的空间用作秘密信息嵌入,可以满足实际应用中的需求,解决实际问题。

    基于边缘指导和多层次特征动态聚合的显著性目标检测方法

    公开(公告)号:CN114529740A

    公开(公告)日:2022-05-24

    申请号:CN202210029292.6

    申请日:2022-01-07

    Abstract: 本发明属于计算机视觉领域,提供了基于边缘指导和多层次特征动态聚合的显著性目标检测方法,包括以下步骤:1)利用VGG‑16主干框架对RGB图像进行初始多层次特征提取并进行编码;2)利用多层次特征动态聚合模块强化多层次特征,生成初始显著性图;3)利用边缘预测模块从主干网络中低层次的特征生成高质量边缘信息图;4)初始显著性图与边缘信息图进行高效融合增强显著性目标的边缘信息,生成高性能最终显著性图。与现有的技术相比,本发明基于边缘指导和多层次特征动态聚合的显著性目标检测方法通过集成两个模块极大提升优化多层次特征的表达能力,进一步提升显著性图的质量。

    聚合密集和注意力多尺度特征的显著性目标检测算法

    公开(公告)号:CN114299305A

    公开(公告)日:2022-04-08

    申请号:CN202111654905.7

    申请日:2021-12-30

    Abstract: 本发明属于计算机视觉领域领域,提供了一种聚合密集和注意力多尺度特征的显著性目标检测算法,包括以下步骤:首先,利用预训练好的ResNet‑50网络作为特征编码器从输入图像中提取初始多层次特征;随后,初始多层次特征通过深层稠密特征探索模块通过平行集成卷积块和稠密连接充分地提取和利用多尺度上下文信息增强特征的多样性和相关性;之后,优化后的多层次特征输入多尺度通道注意力强化模块通过集成多视角注意力特征强化通道中显著性目标信息和压缩背景来生成高质量特征表示;最后,生成的高质量特征表示进行降维和激活,生成的初始显著性图利用混合损失函数进行深层监督训练。

    一种基于跨模态双向互补网络的RGB-D显著性目标检测方法

    公开(公告)号:CN114693953B

    公开(公告)日:2024-08-09

    申请号:CN202210308537.9

    申请日:2022-03-24

    Abstract: 本发明提供一种基于跨模态双向互补网络的RGB‑D显著性目标检测方法,属于图像显著性检测技术,所述方法利用RGB和depth图像的多模态数据,提取跨模态的特征用于推理输入场景的显著性目标或者区域。本发明的贡献主要在于通过从RGB和depth的鲁棒性和抗干扰性的角度出发,设计一种跨模态特征双向互补充机制。该机制利用depth特征优化RGB特征,并通过循环的方式将优化后的RGB特征用于增强depth特征。通过提出的跨模态特征双向互补充机制可以有效地处理RGB图像所遭遇的挑战性场景(低对比度,复杂背景,多目标等),并能够解决低质量深度图带来的负面影响。最后,利用深层特征指导策略集成多尺度特征,生成显著性结果。

Patent Agency Ranking