一种带情感和韵律的语音转换方法及装置
摘要:
本发明公开了一种带情感和韵律的语音转换方法,包括训练阶段和转换阶段,本发明公开的带情感及韵律的语音转换方法及装置,使用带有注意力机制的风格编码层来计算说话人的风格编码向量,将风格编码向量与说话人语音声学特征一同输入带有bottle neck的自编码网络进行训练及转换,最后通过声码器将声学特征转换为音频。在传统语音转换方法的基础上,引入了说话人韵律、情感信息,使得转换的语音带有目标说话人语音的情感和韵律,该方法在多对多、集内对集内、集内对集外、集外对集外等说话人声音转换任务均有较高的相似度、较高的语音质量。
公开/授权文献
0/0