网络视频流乱序分段解码方法

    公开(公告)号:CN104202659A

    公开(公告)日:2014-12-10

    申请号:CN201410471628.X

    申请日:2014-09-16

    Abstract: 本发明提供了一种网络视频流乱序分段解码方法,涉及视频流处理技术领域。本方法首先从网络中捕获传输来的视频数据包,并为每个视频流建立一个缓存,将数据包按序存在对应的位置,当连续数据包达到指定大小时,进行视频解码。采用FFmpeg技术进行数据块解码,解码时修改相应的上下文,通过伪装的方式让FFmpeg继续解码工作。此外本发明采用具有多个加速单元的独立板卡进行解码,加速单元采用FFmpeg技术实现,从而可实现并行解码。无论网络视频流以何种顺序接收,本发明方法均能以数据块为单位将视频流拼接并进行最大程度解码,并可支持多数据流并发解码;本发明方法提高了视频流有效帧数的接收率和解码率。

    一种视频分类方法及装置
    45.
    发明授权

    公开(公告)号:CN109902202B

    公开(公告)日:2021-06-22

    申请号:CN201910015462.3

    申请日:2019-01-08

    Abstract: 本发明提供一种视频分类方法及装置,用以解决相关技术中基于显著性引导的分类模型的分类性能较低的问题。该方法包括:提取待分类视频的关键帧;将所述关键帧输入预先根据训练集训练得到的双路神经网络模型,得到所述视频的分类结果以及所述视频的显著图,所述训练集中包括按照视频类型进行分类的视频以及视频显著图,所述双路神经网络模型包括一路用于对所述视频进行分类的第一子神经网络以及一路用于确定所述视频的显著图的第二子神经网络;将得到的所述显著图中置信度高于第一阈值的显著图加入所述训练集;使用所述训练集中的视频显著图重新训练所述第二子神经网络,得到更新后的双路神经网络模型。本发明有效提高了视频分类的性能。

    一种声学事件检测方法及装置

    公开(公告)号:CN110120230B

    公开(公告)日:2021-06-01

    申请号:CN201910015466.1

    申请日:2019-01-08

    Abstract: 本发明提供一种声学事件检测方法及装置,用以解决相关技术中声学事件检测精度较低的问题。该方法包括:提取待检测的音频的目标特征,得到第一特征数据;将所述第一特征数据分别输入第一GMM模型以及第二GMM模型,得到第一似然概率以及第二似然概率,所述第一GMM模型基于声学事件的音频的特征数据进行训练得到,所述第二GMM模型基于非声学事件的音频的特征数据进行训练得到;根据所述第一似然概率以及所述第二似然概率依次确定所述待检测的音频中各单位音频的类型,所述类型包括声学事件以及非声学事件;将确定出的相邻的类型为声学事件的单位音频合并;当合并后的音频持续的时长超过阈值时,确定发生声学事件。本发明有效提高了声学事件检测的精度。

Patent Agency Ranking