一种语音合成方法、装置、电子设备和存储介质

    公开(公告)号:CN112786012B

    公开(公告)日:2024-05-31

    申请号:CN202011623508.9

    申请日:2020-12-31

    Abstract: 本发明提供一种语音合成方法、装置、电子设备和存储介质,其中方法包括:将初始语音输入至韵律学模型,得到韵律学特征;将韵律学特征和目标音色特征输入至语音合成模型,得到语音合成模型输出的合成结果;其中,韵律学模型是基于各第一语音训练得到的,各第一语音是基于相同的第一韵律学特征和不同的音色合成的;语音合成模型是基于各第二语音及其第二韵律学特征和音色特征训练得到的,第二韵律学特征是将第二语音输入韵律学模型得到的。本发明提供的方法、装置、电子设备和存储介质,韵律学模型输出的韵律学特征与音色无关,提高了语音合成的可靠性和准确性;此外,韵律学模型是针对各语种通用的,极大降低了语音合成任务的实现难度。

    信息合成方法、装置、电子设备和计算机可读存储介质

    公开(公告)号:CN112786005A

    公开(公告)日:2021-05-11

    申请号:CN202011624655.8

    申请日:2020-12-30

    Inventor: 侯秋侠 刘丹

    Abstract: 本发明提供了一种信息合成方法、信息合成装置、电子设备和计算机可读存储介质。根据已训练的自动编解码网络得到第一目标分布,并基于第一目标分布得到目标采样编码;通过已训练的第二编码器对输入信息进行编码,得到输入信息的目标编码;通过已训练的第一解码器根据目标编码对目标采样编码进行解码,得到输出信息。其中,第一目标分布表征从第一编码器输入端到输出端的后验分布,在训练自动编解码网络的过程中,第一编码器与第二编码器的输入样本一一对应,且第二编码器确定的先验分布用于预测第一目标分布。本申请的技术方案可用于语音合成领域,最终合成的语音在韵律、停顿和文字发音等方面具有更好的表现。

Patent Agency Ranking