-
公开(公告)号:CN102203853A
公开(公告)日:2011-09-28
申请号:CN201080000927.5
申请日:2010-01-04
Applicant: 株式会社东芝
CPC classification number: G10L13/02 , G10L19/018
Abstract: 本发明提供了合成语音的方法和装置。根据本发明的一个方面,提供了一种合成带有信息的语音的装置,包括:输入单元,其输入文本句;文本分析单元,其对上述输入单元输入的文本句进行文本分析,以提取语言学信息;参数生成单元,其利用上述文本分析单元提取的语言学信息和预先训练好的统计参数模型,生成语音参数;嵌入单元,其在上述语音参数中嵌入预定的信息;以及语音合成单元,其将利用上述嵌入单元嵌入了上述信息的上述语音参数合成为带有上述信息的语音。
-
公开(公告)号:CN102203853B
公开(公告)日:2013-02-27
申请号:CN201080000927.5
申请日:2010-01-04
Applicant: 株式会社东芝
IPC: G10L13/02 , G10L19/018
CPC classification number: G10L13/02 , G10L19/018
Abstract: 本发明提供了合成语音的方法和装置。根据本发明的一个方面,提供了一种合成带有信息的语音的装置,包括:输入单元,其输入文本句;文本分析单元,其对上述输入单元输入的文本句进行文本分析,以提取语言学信息;参数生成单元,其利用上述文本分析单元提取的语言学信息和预先训练好的统计参数模型,生成语音参数;嵌入单元,其在上述语音参数中嵌入预定的信息;以及语音合成单元,其将利用上述嵌入单元嵌入了上述信息的上述语音参数合成为带有上述信息的语音。
-
公开(公告)号:CN102651217A
公开(公告)日:2012-08-29
申请号:CN201110046580.4
申请日:2011-02-25
Applicant: 株式会社东芝
IPC: G10L13/02
CPC classification number: G10L13/08
Abstract: 本发明涉及一种用于合成语音的方法、设备以及用于训练在语音合成中使用的声学模型的方法。所述用于合成语音的方法可以包括:确定文本分析生成的数据为模糊多音字数据;对所述模糊多音字数据进行模糊多音字预测,以输出所述模糊多音字数据的多个候选发音及其概率;基于所述多个候选发音及其概率,生成模糊上下文特征标注;基于具有模糊决策树的声学模型,针对所述模糊上下文特征标注确定模型参数;对所述模型参数生成语音参数;以及将所述语音参数合成为语音。根据本发明的实施例的方法和设备,可以对中文中难以预测的多音字进行模糊化处理,从而改善中文多音字合成的质量。
-
-