-
公开(公告)号:CN116403609A
公开(公告)日:2023-07-07
申请号:CN202310227888.1
申请日:2023-03-09
申请人: 西安电子科技大学
IPC分类号: G10L25/63 , G10L25/30 , G10L25/03 , G06N3/0499 , G06N3/08
摘要: 本发明公开了一种基于注意力机制的多尺度特征提取的语音情感识别方法,包括:构建训练数据集;构造语音情感识别网络模型,语音情感识别网络模型包括多尺度特征提取器模块、多尺度特征编码器模块、特征融合模块和语音情感识别分类器,其中,多尺度特征提取器模块用于得到不同尺度的多个语音特征,多尺度特征编码器模块用于对语音特征进行编码,得到不同尺度编码后的语音特征;特征融合模块用于得到多尺度语音融合特征;语音情感识别分类器用于利用多尺度语音融合特征得到最终的分类结果;对语音情感识别网络模型进行训练;获得待识别语音的情感识别结果。本发明利用多尺度特征提取器,尽可能地学习语音数据在不同感受野下的特征,保证特征多样性。