一种基于关键帧采样和多尺度稠密网络的长视频分类方法

    公开(公告)号:CN115376052B

    公开(公告)日:2023-04-07

    申请号:CN202211314446.2

    申请日:2022-10-26

    Abstract: 本发明提供了一种基于关键帧采样和多尺度稠密网络的长视频分类方法,包括以下部分:S1、基于直方图差异的视频镜头边缘检测,对待分类视频进行镜头分割处理;S2、基于帧间差值的镜头内关键帧提取,提取S1分割出的视频镜头集合中的关键帧;S3、基于关键帧的长视频采样,利用S2提取到的关键帧将长视频按关键帧进行压缩;S4、基于多尺度稠密网络MSDNet的视频关键帧特征提取,利用多尺度稠密网络MSDNet提取S3压缩后的视频帧序列的特征表示;S5、基于LSTM的视频关键帧序列分类,将S4提取得到的视频帧序列特征表示输入LSTM网络得到视频序列的特征向量,利用得到的特征向量输入线性分类器得到分类结果。

    一种基于关键帧采样和多尺度稠密网络的长视频分类方法

    公开(公告)号:CN115376052A

    公开(公告)日:2022-11-22

    申请号:CN202211314446.2

    申请日:2022-10-26

    Abstract: 本发明提供了一种基于关键帧采样和多尺度稠密网络的长视频分类方法,包括以下部分:S1、基于直方图差异的视频镜头边缘检测,对待分类视频进行镜头分割处理;S2、基于帧间差值的镜头内关键帧提取,提取S1分割出的视频镜头集合中的关键帧;S3、基于关键帧的长视频采样,利用S2提取到的关键帧将长视频按关键帧进行压缩;S4、基于多尺度稠密网络MSDNet的视频关键帧特征提取,利用多尺度稠密网络MSDNet提取S3压缩后的视频帧序列的特征表示;S5、基于LSTM的视频关键帧序列分类,将S4提取得到的视频帧序列特征表示输入LSTM网络得到视频序列的特征向量,利用得到的特征向量输入线性分类器得到分类结果。

Patent Agency Ranking