-
公开(公告)号:CN113628609A
公开(公告)日:2021-11-09
申请号:CN202010387249.8
申请日:2020-05-09
Applicant: 微软技术许可有限责任公司
Abstract: 本公开提供了用于自动音频内容生成的方法和装置。可以获得文本。可以构建与所述文本对应的上下文。可以至少基于所述上下文来确定参考因素,所述参考因素至少包括与所述文本对应的角色类别和/或角色。可以至少基于所述文本和所述参考因素来生成与所述文本对应的语音波形。
-
公开(公告)号:CN112489618A
公开(公告)日:2021-03-12
申请号:CN201910864208.0
申请日:2019-09-12
Applicant: 微软技术许可有限责任公司
IPC: G10L13/047 , G10L13/07 , G10L13/08 , G10L25/30
Abstract: 本公开提供了一种用于通过神经文本到语音(TTS)合成来生成语音的方法和装置。可以获得文本输入。可以生成所述文本输入的音素特征。可以基于与所述文本输入相关联的一组句子来生成所述文本输入的上下文特征。可以基于所述音素特征和所述上下文特征来生成与所述文本输入相对应的语音波形。
-
公开(公告)号:CN112489618B
公开(公告)日:2025-02-11
申请号:CN201910864208.0
申请日:2019-09-12
Applicant: 微软技术许可有限责任公司
IPC: G10L13/047 , G10L13/07 , G10L13/08 , G10L25/30
Abstract: 本公开提供了一种用于通过神经文本到语音(TTS)合成来生成语音的方法和装置。可以获得文本输入。可以生成所述文本输入的音素特征。可以基于与所述文本输入相关联的一组句子来生成所述文本输入的上下文特征。可以基于所述音素特征和所述上下文特征来生成与所述文本输入相对应的语音波形。
-
-