一种基于注意力机制和多任务学习的语音情感识别方法

    公开(公告)号:CN114927144A

    公开(公告)日:2022-08-19

    申请号:CN202210546156.4

    申请日:2022-05-19

    Inventor: 何震宇 刘斌

    Abstract: 本发明的一种基于注意力机制和多任务学习的语音情感识别方法,包括如下步骤:步骤1:获取用于语音情感识别的CASIA汉语情感数据集;步骤2:LSTM_att‑MTL语音情感识别模型由特征提取模块、序列建模模块和多任务学习模块组成,将步骤一中语音情感数据输入识别模型进行协同训练;步骤3:由步骤二中通过softmax分类器得到识别结果,计算识别结果与训练集标签的损失函数由此调整损失大小;步骤4:将测试集语音情感数据输入步骤三训练好的网络中,以实现对测试集语音情感数据识别。本发明构建一个LSTM_att‑MTL模型,该模型解决了传统的特征提取方法计算复杂度较高,训练过程效果不好,导致识别性能降低等问题。

Patent Agency Ranking