Patent search ap:("同济大学") AND inv:"李宇涵" Page 1

1.

发明公开
一种基于半流模型的声码器语音合成方法审中-实审

公开(公告)号：CN114464159A

公开(公告)日：2022-05-10

申请号：CN202210054963.4

申请日：2022-01-18

Applicant: 同济大学

Inventor： 沈莹 , 李宇涵 , 张林 , 赵生捷

IPC: G10L13/02 , G10L25/30 , G10L25/18

Abstract: 本发明涉及一种基于半流模型的声码器语音合成方法，包括：获取待合成的原始音频数据，并载入预先构建并训练好的基于半流模型的声码器中，获取合成的语音波形；所述基于半流模型的声码器包括基于半流的基本模型，该基于半流的基本模型包括多个依次拼接的Flow层，每个Flow层均包括依次连接的半流模型层和卷积网络层，所述半流模型层由自回归流算法和规范化流算法结合构成。与现有技术相比，本发明能够在一定程度上提高合成语音的质量，同时加快合成语音的速度和训练时的收敛速度，并减少一定的计算资源。

Patent Agency Ranking