一种基于半流模型的声码器语音合成方法

    公开(公告)号:CN114464159A

    公开(公告)日:2022-05-10

    申请号:CN202210054963.4

    申请日:2022-01-18

    Applicant: 同济大学

    Abstract: 本发明涉及一种基于半流模型的声码器语音合成方法,包括:获取待合成的原始音频数据,并载入预先构建并训练好的基于半流模型的声码器中,获取合成的语音波形;所述基于半流模型的声码器包括基于半流的基本模型,该基于半流的基本模型包括多个依次拼接的Flow层,每个Flow层均包括依次连接的半流模型层和卷积网络层,所述半流模型层由自回归流算法和规范化流算法结合构成。与现有技术相比,本发明能够在一定程度上提高合成语音的质量,同时加快合成语音的速度和训练时的收敛速度,并减少一定的计算资源。

Patent Agency Ranking