一种基于时空扩散和并行Transformer的动作识别系统及方法

    公开(公告)号:CN117975565A

    公开(公告)日:2024-05-03

    申请号:CN202410208172.1

    申请日:2024-02-26

    Abstract: 一种基于时空扩散和并行Transformer的动作识别系统及方法,系统包括:特征提取模块、两分支Transformer网络、局部运动激励模块、时空扩散模块和视频分类器模块;方法包括:首先将输入视频送入特征提取模块,然后将提取到的视频特征分别送入两分支Transformer网络结构,第一分支由深度可分离卷积和并行Transformer模块构成,第二分支由交叉Transformer模块构成,其次,提出轻量化的局部运动激励模块,该模块可插入到任意Transformer网络中,然后,通过时空扩散模块融合两分支结构得到的时空特征,增强视频长距离时序依赖,最后,借助视频分类器模块输出视频动作识别的结果;本发明具有提升模型识别精度和降低模型训练成本的技术效果。

    基于时序聚合和门控Transformer的动作识别系统及方法

    公开(公告)号:CN116824694B

    公开(公告)日:2025-04-29

    申请号:CN202310663302.6

    申请日:2023-06-06

    Abstract: 基于时序聚合和门控Transformer的动作识别系统及方法,系统包括:依次连接的特征提取模块、第一3D‑ResNet网络、第一下采样模块、第二3D‑ResNet网络、第二下采样模块、第一Transformer网络、第三下采样模块、第二Transformer网络、全局平均池化模块和全连接层;方法包括:特征提取;局部特征增强;全局特征增强;动作识别;本发明通过在浅层网络引入深度可分离卷积模块,并设计卷积算子,同时在深层网络引入门控单元,有效地将卷积神经网络和Transformer网络的优势融合,建立兼顾局部时空关系和全局时空关系的动作识别系统,实现对视频动作外观特征和运动特征的有效提取,具有减少背景信息干扰,降低模型计算量,提高动作识别准确率的特点。

    一种基于稀疏表示的自适应Transformer目标跟踪系统及方法

    公开(公告)号:CN116681727A

    公开(公告)日:2023-09-01

    申请号:CN202310663304.5

    申请日:2023-06-06

    Abstract: 一种基于稀疏表示的自适应Transformer目标跟踪系统及方法,系统包括:特征提取模块,特征提取模块包括块嵌入层、Transformer块、稀疏空间注意模块、稀疏自适应空间剪枝模块以及候选区域重建模块,以及预测头模块;方法包括:将搜索区域图像和模板集图像同时输入特征提取模块,进行特征提取并输出搜索区域特征图与classtoken;将输出的搜索区域特征图与classtoken送入预测头模块,利用预测头模块中的概率头、尺度头与偏差头计算得出预测的目标包围框;利用质量头计算得出搜索区域质量;对当前帧的搜索区域图像以预测的目标包围框为中心裁剪,在模板集图像中对最久未更新的动态模板进行更新;本发明具有计算量低,数据处理速度快以及跟踪精度高的优点。

    基于时序聚合和门控Transformer的动作识别系统及方法

    公开(公告)号:CN116824694A

    公开(公告)日:2023-09-29

    申请号:CN202310663302.6

    申请日:2023-06-06

    Abstract: 基于时序聚合和门控Transformer的动作识别系统及方法,系统包括:依次连接的特征提取模块、第一3D‑ResNet网络、第一下采样模块、第二3D‑ResNet网络、第二下采样模块、第一Transformer网络、第三下采样模块、第二Transformer网络、全局平均池化模块和全连接层;方法包括:特征提取;局部特征增强;全局特征增强;动作识别;本发明通过在浅层网络引入深度可分离卷积模块,并设计卷积算子,同时在深层网络引入门控单元,有效地将卷积神经网络和Transformer网络的优势融合,建立兼顾局部时空关系和全局时空关系的动作识别系统,实现对视频动作外观特征和运动特征的有效提取,具有减少背景信息干扰,降低模型计算量,提高动作识别准确率的特点。

Patent Agency Ranking