一种语音情感识别方法、系统、装置及存储介质

    公开(公告)号:CN118737201A

    公开(公告)日:2024-10-01

    申请号:CN202410981125.0

    申请日:2024-07-22

    Abstract: 本发明公开了一种语音情感识别方法、系统、装置及存储介质,其中方法包括:获取语音信号,根据语音信号获取MFCC特征;对MFCC特征进行特征分割处理,获得音素表征、音节表征和句子表征;根据音素表征、音节表征和句子表征获取不同粒度的情感时频特征,将不同粒度的情感时频特征进行融合,获得最终的多粒度时频特征;根据多粒度时频特征进行情感分类,获得识别结果。本发明同时使用音素、音节和句子特征作为模型的输入特征,通过利用这些语音中固有的不同粒度的特征,给后续模型提供更丰富的情感信息,提高语音情感识别精准度;同时考虑到了语音信号的时域和频域信息,可以获取信息量大且有效的情感表征。本发明可广泛应用于语音处理技术领域。

Patent Agency Ranking