-
公开(公告)号:CN116703980B
公开(公告)日:2023-10-24
申请号:CN202310974990.8
申请日:2023-08-04
Applicant: 南昌工程学院
IPC: G06T7/246 , G06N3/0455 , G06N3/08
Abstract: 本发明提出一种基于金字塔池化Transformer主干网络的目标跟踪方法与系统,该方法包括:在孪生网络框架下,构建基于金字塔池化Transformer特征提取主干网络,基于标准Transformer的编码器和解码器模型,构建得到目标模型预测器;模型预测器和该特征提取主干网络构成目标跟踪模型,通过特征提取主干网络对训练模板以及测试模板进行特征提取;通过模型预测器,利用提取出的训练模板特征以及测试模板特征进行目标模型预测;通过目标模型对跟踪对象进行分类和边界框回归从而实现目标跟踪。本发明可有效减低多头自注意力机制的计算复杂度,最终实现更加高效且准确的目标跟踪。
-
公开(公告)号:CN117333515A
公开(公告)日:2024-01-02
申请号:CN202311636914.2
申请日:2023-12-01
Applicant: 南昌工程学院
IPC: G06T7/246 , G06T7/223 , G06V10/82 , G06V20/40 , G06V10/764 , G06V10/774 , G06N3/0464 , G06N3/0455 , G06N3/082
Abstract: 本发明提出一种基于区域感知注意力的目标跟踪方法与系统,该方法包括:在孪生双分支结构下,基于区域感知编码器模块构建区域感知注意力特征提取器;基于模型初始化模块以及模型优化模块构建模型预测器,基于卷积模块构建目标分类器;区域感知注意力特征提取器、模型预测器以及目标分类器共同构成目标跟踪框架;区域感知注意力特征提取器分别从训练集以及测试帧中提取模板特征以及搜索特征,模型预测器利用模板特征以及目标边界框信息生成目标模型,目标分类器利用目标模型在搜索特征中定位目标位置。本发明采用动态性的区域感知稀疏注意力机制,可以实现区域自适应,实时动态选择目标感兴趣区域,从而有效减低多头自注意力机制的计算复杂度。
-
公开(公告)号:CN117333515B
公开(公告)日:2024-02-09
申请号:CN202311636914.2
申请日:2023-12-01
Applicant: 南昌工程学院
IPC: G06T7/246 , G06T7/223 , G06V10/82 , G06V20/40 , G06V10/764 , G06V10/774 , G06N3/0464 , G06N3/0455 , G06N3/082
Abstract: 本发明提出一种基于区域感知注意力的目标跟踪方法与系统,该方法包括:在孪生双分支结构下,基于区域感知编码器模块构建区域感知注意力特征提取器;基于模型初始化模块以及模型优化模块构建模型预测器,基于卷积模块构建目标分类器;区域感知注意力特征提取器、模型预测器以及目标分类器共同构成目标跟踪框架;区域感知注意力特征提取器分别从训练集以及测试帧中提取模板特征以及搜索特征,模型预测器利用模板特征以及目标边界框信息生成目标模型,目标分类器利用目标模型在搜索特征中定位目标位置。本发明采用动态性的区域感知稀疏注意力机制,可以实现区域自适应,实时动态选(56)对比文件Yutao Cui,et al..MixFormer: End-to-End Tracking with Iterative MixedAttention《.IEEE》.2022,全文.Shuo Wang,et al..Classification ofHyperspectral and LiDAR Data Using Multi-Modal Transformer Cascaded Fusion Net.《remote sensing》.2023,全文.
-
公开(公告)号:CN116703980A
公开(公告)日:2023-09-05
申请号:CN202310974990.8
申请日:2023-08-04
Applicant: 南昌工程学院
IPC: G06T7/246 , G06N3/0455 , G06N3/08
Abstract: 本发明提出一种基于金字塔池化Transformer主干网络的目标跟踪方法与系统,该方法包括:在孪生网络框架下,构建基于金字塔池化Transformer特征提取主干网络,基于标准Transformer的编码器和解码器模型,构建得到目标模型预测器;模型预测器和该特征提取主干网络构成目标跟踪模型,通过特征提取主干网络对训练模板以及测试模板进行特征提取;通过模型预测器,利用提取出的训练模板特征以及测试模板特征进行目标模型预测;通过目标模型对跟踪对象进行分类和边界框回归从而实现目标跟踪。本发明可有效减低多头自注意力机制的计算复杂度,最终实现更加高效且准确的目标跟踪。
-
-
-