一种说话人语音自适应训练方法
摘要:
本发明公开了一种说话人语音自适应训练方法,属于语音合成技术领域,包括:给定训练情感语音数据和目标说话人情感语音数据;对声学参数进行表征,并对声学参数的状态输出分布和时长分布进行估计、建模;对训练语音数据模型状态输出分布和平均音模型状态输出分布的差异进行归一化处理,得到目标说话人情感语音数据的平均音模型;对平均音模型进行说话人自适应变换,得到说话人相关的自适应模型。本发明示例的说话人语音自适应训练方法,得到的自适应模型用于语音合成,可以减小语音库中说话人的差异所造成的影响,提高合成语音的情感相似度,只用少量的待合成的情感语料,就能够合成出自然度、流利度、情感相似度都很好的情感语音。
公开/授权文献
0/0