基于数据增强和卷积循环神经网络的环境声音分类方法

    公开(公告)号:CN113658607A

    公开(公告)日:2021-11-16

    申请号:CN202110838615.1

    申请日:2021-07-23

    Abstract: 本发明公开了一种基于数据增强和卷积循环神经网络的环境声音分类方法,包括:对环境声音音频进行预处理,提取对数gammatone频谱图特征,去除特征中的静音帧,并对特征值进行归一化处理;设计基于卷积循环神经网络的环境声音分类系统,将用于特征提取的堆叠卷积神经网络与用于时间信息捕捉的循环神经网络相结合,实现图像特征向时间序列的转化;对数据集ESC‑10和数据集ESC‑50应用数据增强。本发明对环境声音进行特征提取,对其进行数据增强并用于卷积循环神经网络的训练,从而实现环境声音的分类并提高分类准确性与稳定性。

Patent Agency Ranking