一种基于膨胀注意力机制的段级多尺度动作分割方法

    公开(公告)号:CN117593790A

    公开(公告)日:2024-02-23

    申请号:CN202311547061.5

    申请日:2023-11-20

    Inventor: 李成严 王昊 窦毅

    Abstract: 一种基于膨胀注意力机制的段级多尺度动作分割方法,涉及动作分割技术领域。本发明是为了解决现有动作分割方法分割准确率低的问题。本发明包括:获取待分割视频,并将待分割视频输入到预训练好的I3D模型中,获得待分割视频的帧级特征集合;将帧级特征输入到主干网络中,获得每一个帧级特征的类标签集合;将帧级特征按照类标签划分为N1个段落,并将N1个段落输入到动作分割模型中,获得分割出的视频片段;动作分割模型由多注意力编码器和多尺度级膨胀Transformer细化器组成;最后,对分割出的视频片段进行边界回归,获得最终分割出的动作片段。本发明用于视频动作分割。

Patent Agency Ranking