-
公开(公告)号:CN115985291A
公开(公告)日:2023-04-18
申请号:CN202211740485.9
申请日:2022-12-30
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种语音合成方法、装置、电子设备和存储介质,其中方法包括:获取待合成的文本;基于所述文本进行声学建模,得到所述文本对应的语音特征,所述语音特征与样本语音特征处于同一特征空间,所述样本语音特征是端到端语音合成模型或自监督语音特征提取模型对样本语音进行特征提取得到的;基于所述语音特征进行波形重构,得到所述文本对应的合成语音。本发明实施例提供的方法,将与基于端到端语音合成模型或自监督语音特征提取模型提取的样本语音特征处于同一特征空间内的语音特征,作为声学模型与声码器之间的桥梁以实现语音合成,从而使得语音合成过程中能够参考到更加丰富的声学信息,由此提高合成语音的语音质量。
-
公开(公告)号:CN114333760A
公开(公告)日:2022-04-12
申请号:CN202111679120.5
申请日:2021-12-31
Applicant: 科大讯飞股份有限公司
IPC: G10L13/02 , G10L13/08 , G10L13/10 , G06F16/35 , G06F40/242 , G06F40/284 , G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本申请提供了一种信息预测模块的构建方法、信息预测方法及相关设备,构建方法包括:以能获得文本单元在不同语境下的语义信息为目标,构建文本处理模块;基于文本处理模块和预设的多种语音合成前端信息预测任务构建多任务处理模块;对多任务处理模块进行处理,以使处理后的多任务处理模块具备处理多种语音合成前端信息的预测任务的能力,处理后的模块作为构建的信息预测模块。经由本申请提供的构建方法可构建出同时对多种语音合成前端信息进行预测的模块。在构建方法的基础上,本申请还提供了可同时预测多种语音合成前端信息的信息预测方法,在此基础上,本申请还提供了可同时预测出较为准确的韵律词边界和调核位置的信息预测方法。
-
公开(公告)号:CN114299911A
公开(公告)日:2022-04-08
申请号:CN202111630204.X
申请日:2021-12-28
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音合成方法及相关装置、电子设备和存储介质,其中,语音合成方法包括:将待合成文本进行口语化转换,得到口语化文本;其中,口语化转换参考至少一种转换模式;提取口语化文本的音素序列,并预测口语化文本的口语化控制标签;其中,口语化控制标签用于控制发音状态;基于音素序列和口语化控制标签,合成得到待合成文本的口语化语音。上述方案,能够实现口语化的语音合成,以提升用户交互体验。
-
公开(公告)号:CN114283781A
公开(公告)日:2022-04-05
申请号:CN202111650035.6
申请日:2021-12-30
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音合成方法及相关装置、电子设备和存储介质,其中,语音合成方法包括:获取待合成文本、第一语音属性和第二语音属性;其中,第一语音属性包括情感类别、风格类别中至少一者,第二语音属性包括说话人标识;获取具有第一语音属性的全局韵律特征,并基于待合成文本、第一语音属性和第二语音属性进行预测,得到局部韵律特征;其中,全局韵律特征包含句子级韵律特征信息,局部韵律特征包含字词级韵律特征信息;基于待合成文本、全局韵律特征和局部韵律特征进行合成,得到合成语音。上述方案,能够自由合成不同韵律的语音,提升对不同场景的适应性。
-
公开(公告)号:CN112786018A
公开(公告)日:2021-05-11
申请号:CN202011634065.3
申请日:2020-12-31
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音转换及相关模型的训练方法、电子设备和存储装置,其中,语音转换模型的训练方法包括:获取目标对象的第一样本语音以及预训练的语音转换模型;语音转换模型是利用样本对象的第二样本语音及其经音色转换后的第三样本语音预训练得到的;利用音素识别网络识别第一样本语音的第一音素信息,并提取第一样本语音的第一实际声学信息;利用声学预测网络对第一音素信息和第一实际声学信息进行预测,得到第一预测声学信息,并基于第一实际声学信息和第一预测声学信息之间的差异,调整声学预测网络的网络参数;将音素识别网络和调整后的声学预测网络的组合,作为与目标对象匹配的语音转换模型。上述方案,能够提高语音转换的质量。
-
公开(公告)号:CN112767914A
公开(公告)日:2021-05-07
申请号:CN202011627562.0
申请日:2020-12-31
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种歌唱语音合成方法及合成设备、计算机存储介质,该合成方法包括:获取乐谱信息;对乐谱信息进行特征提取,以获得乐谱特征;对乐谱特征进行基频特征预测,以获得基频特征;结合基频特征对乐谱特征进行声学特征预测,以获得声学特征;根据声学特征得到合成后的歌唱语音数据。本申请所提供的合成方法能够提高歌唱语音合成的准确性以及自然度。
-
-
-
-
-