基于多分类器交互学习的语音情感识别方法

    公开(公告)号:CN112837701A

    公开(公告)日:2021-05-25

    申请号:CN202011623065.3

    申请日:2020-12-31

    IPC分类号: G10L25/63 G06K9/62

    摘要: 本发明提出一种针对语音中的较为模糊情感的识别方法,主要解决现有技术中大多数语音数据为模糊数据,情感识别准确率低及人工注释标签成本较高的问题。其实现方案是:1)通过少量具有精确标签的数据对五个分类器进行初次训练得到五个模型,并用这五个模型为模糊数据构造一个模糊标签;2)用具有模糊标签的数据二次训练五个模型,得到的训练好的五个情感分类模型;3)将少量无标签数据放入训练好的五个模型进行语音情感识别,得到对愤怒、高兴、平静、恐慌和悲伤这五种情感分类判别的准确率;4)选择准确率最高的结果作为数据标签为情感分类结果。本发明提高了模糊数据处理能力,识别准确率高,成本低,可用于健康检索、信息安全及机器人。

    基于注意力机制的多尺度特征提取的语音情感识别方法

    公开(公告)号:CN116403609A

    公开(公告)日:2023-07-07

    申请号:CN202310227888.1

    申请日:2023-03-09

    摘要: 本发明公开了一种基于注意力机制的多尺度特征提取的语音情感识别方法,包括:构建训练数据集;构造语音情感识别网络模型,语音情感识别网络模型包括多尺度特征提取器模块、多尺度特征编码器模块、特征融合模块和语音情感识别分类器,其中,多尺度特征提取器模块用于得到不同尺度的多个语音特征,多尺度特征编码器模块用于对语音特征进行编码,得到不同尺度编码后的语音特征;特征融合模块用于得到多尺度语音融合特征;语音情感识别分类器用于利用多尺度语音融合特征得到最终的分类结果;对语音情感识别网络模型进行训练;获得待识别语音的情感识别结果。本发明利用多尺度特征提取器,尽可能地学习语音数据在不同感受野下的特征,保证特征多样性。

    基于多分类器交互学习的语音情感识别方法

    公开(公告)号:CN112837701B

    公开(公告)日:2022-12-27

    申请号:CN202011623065.3

    申请日:2020-12-31

    IPC分类号: G10L25/63 G06K9/62

    摘要: 本发明提出一种针对语音中的较为模糊情感的识别方法,主要解决现有技术中大多数语音数据为模糊数据,情感识别准确率低及人工注释标签成本较高的问题。其实现方案是:1)通过少量具有精确标签的数据对五个分类器进行初次训练得到五个模型,并用这五个模型为模糊数据构造一个模糊标签;2)用具有模糊标签的数据二次训练五个模型,得到的训练好的五个情感分类模型;3)将少量无标签数据放入训练好的五个模型进行语音情感识别,得到对愤怒、高兴、平静、恐慌和悲伤这五种情感分类判别的准确率;4)选择准确率最高的结果作为数据标签为情感分类结果。本发明提高了模糊数据处理能力,识别准确率高,成本低,可用于健康检索、信息安全及机器人。