-
公开(公告)号:CN110782870A
公开(公告)日:2020-02-11
申请号:CN201910839744.5
申请日:2019-09-06
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L13/08 , G10L13/10 , G10L15/18 , G06F40/284 , G06F40/58
Abstract: 本申请公开了一种语音合成方法、装置、电子设备及存储介质,涉及人工智能技术,利用人工智能中机器学习技术进行语音合成,该方法包括:获得输入文本对应的分词序列;利用已训练的基于注意力机制的语言表征模型确定分词序列对应的向量序列;利用韵律结构模型对向量序列进行韵律结构预测处理,确定韵律结构信息,韵律结构信息包括向量序列中的各特征向量对应的分词片段在合成的语音中对应的停顿时长和发音轻重;根据韵律结构信息和分词序列中各分词片段对应的读音,合成输入文本对应的语音。本申请提供的语音合成方法、装置、电子设备及存储介质,基于语言表征模型得到的向量序列,可表达出输入文本准确真实的语义,使得听合成语音起来更加自然。
-
公开(公告)号:CN110782870B
公开(公告)日:2023-06-16
申请号:CN201910839744.5
申请日:2019-09-06
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L13/08 , G10L13/10 , G10L15/18 , G06F40/284 , G06F40/58
Abstract: 本申请公开了一种语音合成方法、装置、电子设备及存储介质,涉及人工智能技术,利用人工智能中机器学习技术进行语音合成,该方法包括:获得输入文本对应的分词序列;利用已训练的基于注意力机制的语言表征模型确定分词序列对应的向量序列;利用韵律结构模型对向量序列进行韵律结构预测处理,确定韵律结构信息,韵律结构信息包括向量序列中的各特征向量对应的分词片段在合成的语音中对应的停顿时长和发音轻重;根据韵律结构信息和分词序列中各分词片段对应的读音,合成输入文本对应的语音。本申请提供的语音合成方法、装置、电子设备及存储介质,基于语言表征模型得到的向量序列,可表达出输入文本准确真实的语义,使得听合成语音起来更加自然。
-