具有多级别文本信息的神经文本到语音合成

    公开(公告)号:CN112352275B

    公开(公告)日:2024-11-22

    申请号:CN201880091963.3

    申请日:2018-12-13

    Inventor: 明怀平 何磊

    Abstract: 用于通过神经文本到语音(TTS)合成来生成语音的方法和装置。可以获得文本输入(1310)。可以基于所述文本输入来生成音素或字符级别文本信息(1320)。可以基于所述文本输入来生成上下文敏感文本信息(1330)。可以基于所述音素或字符级别文本信息和所述上下文敏感文本信息来生成文本特征(1340)。可以至少基于所述文本特征来生成与所述文本输入相对应的语音波形(1350)。

    具有多级别文本信息的神经文本到语音合成

    公开(公告)号:CN112352275A

    公开(公告)日:2021-02-09

    申请号:CN201880091963.3

    申请日:2018-12-13

    Inventor: 明怀平 何磊

    Abstract: 用于通过神经文本到语音(TTS)合成来生成语音的方法和装置。可以获得文本输入(1310)。可以基于所述文本输入来生成音素或字符级别文本信息(1320)。可以基于所述文本输入来生成上下文敏感文本信息(1330)。可以基于所述音素或字符级别文本信息和所述上下文敏感文本信息来生成文本特征(1340)。可以至少基于所述文本特征来生成与所述文本输入相对应的语音波形(1350)。

Patent Agency Ranking