-
公开(公告)号:CN107221344A
公开(公告)日:2017-09-29
申请号:CN201710222674.X
申请日:2017-04-07
Applicant: 南京邮电大学
IPC: G10L25/63 , G10L13/02 , G10L15/02 , G10L15/06 , G10L15/16 , G10L19/02 , G10L25/27 , G10L25/30 , G06N3/08
CPC classification number: G10L25/63 , G06N3/084 , G10L13/02 , G10L15/02 , G10L15/06 , G10L15/16 , G10L19/02 , G10L25/27 , G10L25/30
Abstract: 本发明公开了一种语音情感迁移方法,首先基于语音数据库生成语音情感数据集,完成标签标注,然后采用语音特征参数模型对音频文件进行音频特征抽取,得到语音特征集;接下来采用机器学习工具对语音特征集与语音情感标签进行机器学习,构建情感模型库。选择待迁移的目标,从多媒体终端输入语音信号,得到当前语音信号的特征集,通过情感分类得到当前情感类别,判断与输入的目标是否一致,如果一致则将原始输入语音信号直接作为目标情感语音输出,否则进行特征情感迁移;最后经过语音合成加工生成最终目标情感语音输出。本发明提出的基于情感分类和特征迁移的方法,能够在不失原始说话人发声特征的前提下实现语音情感的变化。