一种基于时间域信息传递的视频目标检测方法

    公开(公告)号:CN114758279B

    公开(公告)日:2024-11-15

    申请号:CN202210443675.8

    申请日:2022-04-24

    Abstract: 本发明属于计算机视觉领域,提供了一种基于时间域信息传递的视频目标检测方法,包括以下步骤:1)获取并输入视频数据;2)对视频帧进行分成每m一组;3)通过信息传递模块,首先对每一组连续帧进行合并,获取特征并通过门控循环单元实现上下文信息的传递;4)利用YOLOV5对数据进行后续检测,使用Focal Loss交叉熵损失与DIoU Loss函数训练此模型。与现有的技术相比,本发明基于YOLOV5模型对其进行了改进使其更注重连续帧中相邻帧的信息,可以有效提升目标检测的质量。

    集成多源特征网络的显著性目标检测算法

    公开(公告)号:CN114119978B

    公开(公告)日:2024-08-09

    申请号:CN202111461687.5

    申请日:2021-12-03

    Abstract: 本发明属于计算机视觉领域,提供了一种集成多源特征网络的显著性目标检测算法,包括以下步骤:1)利用ResNet‑50主干网络从RGB图像提取初始多层次特征;2)利用多尺度特征聚合模块充分提取多尺度特征,聚合优化多层次特征增加特征多样性;3)利用全局特征提取器从初始特征中提取更高层次语义信息;4)利用关联特征交互模块互补性融合交互多层次特征,生成最显著特征表示;5)利用深度监督模块将最显著特征表示降维激活生成显著性图并利用真值标签以端到端的方式进行训练监督。通过与现存的最先进的显著性目标检测算法相比,本发明集成多源特征网络的显著性目标检测算法具有很大的优势。

    一种基于密集特征提取与轻量级网络的多类商品目标检测方法

    公开(公告)号:CN114998609B

    公开(公告)日:2024-06-25

    申请号:CN202210544450.1

    申请日:2022-05-18

    Abstract: 本发明提出了一种基于密集特征提取与轻量级网络的多类商品目标检测方法,本方法主要应用于多类商品目标检测中,包括:收集主流购物APP上的商品图片,将商品分类,进行人工标注,划分为训练集和验证集;使用数据增强Cutout和Mixup操作解决数据不纯、重复等问题,扩充数据集;利用MobileNetV2网络提取多层次局部特征,利用Swin Transformer获取全局特征,并将多层次局部特征嵌入到Transformer结构中进行融合,最后对损失函数优化,将模型应用到多类密集的商品检测中。本发明可以对多种不同大小商品目标进行快速精准的分类和定位,同时整体网络模型的参数对比同类目标检测内存占用小、推断速度快、性能好、参数小,可以应用于移动端和嵌入设备,解决实际生活中问题。

    一种混合CNN与Transformer的域泛化注视估计算法

    公开(公告)号:CN117173773A

    公开(公告)日:2023-12-05

    申请号:CN202311328554.X

    申请日:2023-10-14

    Abstract: 本发明属于计算机视觉领域,提供了混合CNN与Transformer的域泛化注视估计算法,包括以下步骤:首先,采用ResNest‑50与ViT双流特征提取网络进行特征提取并使用ResNest‑50分支的多层融合特征作为ViT网络的输入以代替使用全脸图像作为输入;随后,为缓解ResNest分支与ViT分支的输出特征的维度和语义差异,特征融合增强模块(FFEM)被设计用于融合双分支的输出特征;之后,一种基于对抗策略的域泛化方法被提出用来提升模型的跨域性能。一个额外的图像重建任务被设计用来与注视估计任务进行对抗性学习,并使用互信息神经估计器(MINE)来计算图像重建任务和注视估计任务的特征空间的互信息以解耦注视无关特征(个体外观等)与注视相关特征;最后利用混合损失函数进行深度监督训练。

    集成多源特征网络的显著性目标检测算法

    公开(公告)号:CN114119978A

    公开(公告)日:2022-03-01

    申请号:CN202111461687.5

    申请日:2021-12-03

    Abstract: 本发明属于计算机视觉领域,提供了一种集成多源特征网络的显著性目标检测算法,包括以下步骤:1)利用ResNet‑50主干网络从RGB图像提取初始多层次特征;2)利用多尺度特征聚合模块充分提取多尺度特征,聚合优化多层次特征增加特征多样性;3)利用全局特征提取器从初始特征中提取更高层次语义信息;4)利用关联特征交互模块互补性融合交互多层次特征,生成最显著特征表示;5)利用深度监督模块将最显著特征表示降维激活生成显著性图并利用真值标签以端到端的方式进行训练监督。通过与现存的最先进的显著性目标检测算法相比,本发明集成多源特征网络的显著性目标检测算法具有很大的优势。

    基于实例级自适应深度估计的单目三维目标检测算法

    公开(公告)号:CN116703996A

    公开(公告)日:2023-09-05

    申请号:CN202310517996.2

    申请日:2023-05-09

    Abstract: 本发明属于计算机视觉领域领域,提供了一种基于实例级自适应深度估计的单目三维目标检测算法,包括以下步骤:首先利用从ImageNet中训练好的DLA‑34主干网络,作为编码器从输入图像中编码初始多层次特征;然后,利用全局的特征表示,将预测最终深度值作为离散深度区间中心值和实例特征概率表示的线性组合,结合二维目标检测区域分布获得实例级的稀疏深度图,并得到隐含的深度空间线索特征信息;之后,利用空间增强注意力模块将深度线索特征信息引入三维目标检测分支,并通过金字塔池化操作学习不同尺度下的目标空间特征表示;最后,利用多个损失函数分层优化多个检测任务的监督学习,并利用混合损失函数训练此模型。

Patent Agency Ranking