基于空洞深度可分离群卷积轻量级网络的语音情绪识别方法

    公开(公告)号:CN115985345A

    公开(公告)日:2023-04-18

    申请号:CN202211680936.4

    申请日:2022-12-27

    Abstract: 本发明涉及语音情绪识别领域,特别涉及一种基于空洞深度可分离群卷积轻量级网络的语音情绪识别方法,包括采用短期傅里叶变换对音频信号时频转换获得其输入特征图;采用逐点群卷积层对输入特征图降维和分解;采用深度空洞可分离卷积层将低维特征图转换成若干组与原始输入特征图同一维度的特征图;采用相似性判定模块判定该特征图是否符合情绪分类标准;采用分层特征融合技术将若干组特征图串联起来,生成输出特征图;采用下采样学习音频信号的时空特性,同时将输入特征图经过平均池化层实现维度匹配,将输出特征图与这二者进行串联叠加得到最终特征图;将最终特征表示进行情绪预测;本发明在不降低语音情绪识别精度的前提下大幅降低系统的复杂度。

Patent Agency Ranking