-
公开(公告)号:CN119763546A
公开(公告)日:2025-04-04
申请号:CN202411951237.8
申请日:2024-12-27
Applicant: 科大讯飞股份有限公司
IPC: G10L13/08 , G10L13/027 , G10L13/04
Abstract: 本发明提供一种语音合成方法、系统、电子设备及存储介质,其中方法包括:将待合成的目标文本输入至语音合成模型中的文本处理模块,得到所述文本处理模块输出的语音特征;将所述目标文本中的情感信息输入至所述语音合成模型中的情感编码器,得到所述情感编码器输出的情感特征;将所述语音特征和所述情感特征输入至所述语音合成模型中的声学模型,得到所述声学模型中的多个专家模块组合输出的声学特征;将所述声学特征输入至所述语音合成模型中的声码器,得到所述声码器输出的所述目标文本对应的合成语音。本发明实现富有情感且拟人化程度高的语音合成,提升了超拟人多情感的语音合成中的情感效果和语音合成质量。
-
公开(公告)号:CN117935773A
公开(公告)日:2024-04-26
申请号:CN202311868862.1
申请日:2023-12-28
Applicant: 科大讯飞股份有限公司
IPC: G10L13/10 , G10L13/033
Abstract: 本申请公开了一种语音合成方法、语音合成模型的训练方法和相关装置,该方法包括:获取目标对象的目标参考语音和目标文本的文本特征;基于目标参考语音,提取目标对象的语音韵律特征;至少将语音韵律特征与文本特征进行融合,以得到第一融合特征;基于第一融合特征生成目标对象对应目标文本的目标声学特征,能够提高语音合成的真实性。
-