声音转换模型的训练方法、电子设备及存储介质

    公开(公告)号:CN112802462B

    公开(公告)日:2024-05-31

    申请号:CN202011627564.X

    申请日:2020-12-31

    Abstract: 本申请公开了一种声音转换模型的训练方法、电子设备及存储介质。该方法包括:从第一语音数据集中获取第一训练语音数据,其中,第一语音数据集中包括目标说话人的多条语音数据,第一训练语音数据对应第一声学特征;获取第一声学特征对应的后验概率特征;将第一声学特征对应的后验概率特征和第一辅助音色特征输入声音转换模型,得到第一平行特征;获取第一平行特征对应的后验概率特征;将第一平行特征对应的后验概率特征和目标音色特征输入声音转换模型,得到第二声学特征;基于第二声学特征和第一声学特征之间的差异,调整声音转换模型的参数。通过上述方式,能够提高声音转换模型的转换效果。

    声音转换模型的训练方法、电子设备及存储介质

    公开(公告)号:CN112802462A

    公开(公告)日:2021-05-14

    申请号:CN202011627564.X

    申请日:2020-12-31

    Abstract: 本申请公开了一种声音转换模型的训练方法、电子设备及存储介质。该方法包括:从第一语音数据集中获取第一训练语音数据,其中,第一语音数据集中包括目标说话人的多条语音数据,第一训练语音数据对应第一声学特征;获取第一声学特征对应的后验概率特征;将第一声学特征对应的后验概率特征和第一辅助音色特征输入声音转换模型,得到第一平行特征;获取第一平行特征对应的后验概率特征;将第一平行特征对应的后验概率特征和目标音色特征输入声音转换模型,得到第二声学特征;基于第二声学特征和第一声学特征之间的差异,调整声音转换模型的参数。通过上述方式,能够提高声音转换模型的转换效果。

    语音合成方法及相关装置、电子设备和存储介质

    公开(公告)号:CN118471186A

    公开(公告)日:2024-08-09

    申请号:CN202410515587.3

    申请日:2024-04-26

    Abstract: 本申请公开了一种语音合成方法及相关装置、电子设备和存储介质,其中,语音合成方法包括:获取待合成文本和目标对象的参考语音;基于待合成文本的音素序列进行编码,得到音素序列中各个音素的音素编码特征,并基于参考语音进行编码,得到多尺度语音特征,以及获取音素序列中各个音素的预测发音时长;基于多尺度语音特征以及各个音素的音素编码特征和预测发音时长进行解码,得到合成语音;其中,多尺度语音特征包括音素级语音特征、帧级语音特征、全局语音特征中至少两者。上述方案,有助于在语音合成中尽可能地保留目标对象诸如发音、韵律等细节信息,能够提升语音合成的相似性。

Patent Agency Ranking