一种基于内外语义聚合的视频目标检测方法

    公开(公告)号:CN112966581B

    公开(公告)日:2022-05-27

    申请号:CN202110213113.X

    申请日:2021-02-25

    Applicant: 厦门大学

    Abstract: 一种基于内外语义聚合的视频目标检测方法,涉及计算机视觉技术。包括步骤:A.准备训练样本集,依次包括当前帧、支持帧,首先在当前序列随机选取一帧作为当前帧,再在当前帧附近随机选取几帧作为支持帧,为当前帧的训练提供丰富的时空信息。B.预处理训练样本集,对当前帧,支持帧进行随机翻转、裁剪等操作,进一步增大训练样本多样性。C.在每帧内进行内部语义聚合,实现单个帧自身的空间语义增强。D.联合三帧进行外部语义聚合,实现三帧时空信息的语义增强。E.对经过内外语义聚合的当前帧特征进行分类和回归,得到最后的检测结果,包括检测框和预测所属类别。可以有效地聚合视频中的时空语义信息,从而有效地提高目标检测器的性能。

    一种基于内外语义聚合的视频目标检测方法

    公开(公告)号:CN112966581A

    公开(公告)日:2021-06-15

    申请号:CN202110213113.X

    申请日:2021-02-25

    Applicant: 厦门大学

    Abstract: 一种基于内外语义聚合的视频目标检测方法,涉及计算机视觉技术。包括步骤:A.准备训练样本集,依次包括当前帧、支持帧,首先在当前序列随机选取一帧作为当前帧,再在当前帧附近随机选取几帧作为支持帧,为当前帧的训练提供丰富的时空信息。B.预处理训练样本集,对当前帧,支持帧进行随机翻转、裁剪等操作,进一步增大训练样本多样性。C.在每帧内进行内部语义聚合,实现单个帧自身的空间语义增强。D.联合三帧进行外部语义聚合,实现三帧时空信息的语义增强。E.对经过内外语义聚合的当前帧特征进行分类和回归,得到最后的检测结果,包括检测框和预测所属类别。可以有效地聚合视频中的时空语义信息,从而有效地提高目标检测器的性能。

Patent Agency Ranking