一种多时间尺度下的骨骼行为识别视频帧提取方法及系统

    公开(公告)号:CN116469172A

    公开(公告)日:2023-07-21

    申请号:CN202310496638.8

    申请日:2023-04-27

    Inventor: 陈宏伟 李梦杰

    Abstract: 本发明提供一种多时间尺度下的骨骼行为识别视频帧提取方法及系统,其技术要点在于,所述方法包括:首先通过目标检测算法对视频中的人物进行框选,获得视频中人物的位置信息,再使用人体关键点估计算法获得视频中人物信息的关键点位置,随后对堆叠后的人体关键点热图进行均匀采样,将均匀采样后的帧进行低中高频采样,使得模型能够从粗粒度到细粒度分层次学习到对于视频不同尺度下的特征,从而加强3D‑CNN对长视频的理解能力;最后,对多尺度下不同频率帧采用并行方式卷积通道,获取对应的特征信息,将特征信息经过判断结果并归一化处理,根据识别后的概率结果,最终输出为行为识别类别。本发明能够在保证分类的精度的前提下提高模型在长视频上的表现。

Patent Agency Ranking