基于多领域统计特征和改进CNN的含噪语音情感识别方法

    公开(公告)号:CN115050395B

    公开(公告)日:2024-10-29

    申请号:CN202210494189.9

    申请日:2022-05-07

    Abstract: 本发明提出了一种基于多领域统计特征和改进CNN的含噪语音情感识别方法,属于语音识别领域,包括以下步骤:步骤1:首先对语料库中的纯净语音进行加噪处理,其次提取语音信号的相关多领域特征,采用统计函数对已提取的特征进行筛选,降低特征冗余度,得到冗余度低、情感区分度高的多领域统计特征;步骤2:搭建基于语音增强联合约束CNN‑DNN的框架;步骤3:将多领域统计特征作为系统模型的输入,提取与情感分类标签高度相关且对噪声具有鲁棒性的信息,得到输出层的情感分类结果;步骤4:对所提出的一种基于多领域统计特征和语音增强联合约束CNN‑DNN的噪声环境下语音情感识别方法进行性能评估。

    基于深度学习的跨语料库语音情感识别方法

    公开(公告)号:CN115331698A

    公开(公告)日:2022-11-11

    申请号:CN202210492667.2

    申请日:2022-05-07

    Abstract: 本发明提出了一种基于深度学习的跨语料库语音情感识别方法,属于语音识别技术领域,包括以下步骤:步骤1:提取语音信号的MFCC特征及其统计特征,将其作为系统的输入,表征与情感分类标签高度相关的信息;步骤2:将这两个语料库的统计特征作为DNN的输入,用于训练DNN模型,建立源域特征到目标域特征的迁移学习关系,实现两个域统计特征的变换对齐,提升两个语料库特征之间的领域自适应能力;步骤3:根据混淆度矩阵构建以CNN为树节点的多级分类模型;步骤4:对齐后的源域数据作为该CNN‑决策树模型的输入进行最终情感分类评估。

    基于多领域统计特征和改进CNN的含噪语音情感识别方法

    公开(公告)号:CN115050395A

    公开(公告)日:2022-09-13

    申请号:CN202210494189.9

    申请日:2022-05-07

    Abstract: 本发明提出了一种基于多领域统计特征和改进CNN的含噪语音情感识别方法,属于语音识别领域,包括以下步骤:步骤1:首先对语料库中的纯净语音进行加噪处理,其次提取语音信号的相关多领域特征,采用统计函数对已提取的特征进行筛选,降低特征冗余度,得到冗余度低、情感区分度高的多领域统计特征;步骤2:搭建基于语音增强联合约束CNN‑DNN的框架;步骤3:将多领域统计特征作为系统模型的输入,提取与情感分类标签高度相关且对噪声具有鲁棒性的信息,得到输出层的情感分类结果;步骤4:对所提出的一种基于多领域统计特征和语音增强联合约束CNN‑DNN的噪声环境下语音情感识别方法进行性能评估。

Patent Agency Ranking