语音信号生成方法和装置

发明授权

请登陆查看更多内容

专利标题： 语音信号生成方法和装置
申请号： CN201810209741.9

申请日： 2018-03-14
公开(公告)号： CN108182936B

公开(公告)日： 2019-05-03
发明人: 顾宇 , 康永国
申请人： 百度在线网络技术(北京)有限公司
申请人地址： 北京市海淀区上地十街10号百度大厦三层
专利权人： 百度在线网络技术(北京)有限公司
当前专利权人： 百度在线网络技术(北京)有限公司
当前专利权人地址： 北京市海淀区上地十街10号百度大厦三层
代理机构： 北京英赛嘉华知识产权代理有限责任公司
代理商 王达佐; 马晓亚
主分类号： G10L13/02
IPC分类号： G10L13/02 ; G10L15/02 ; G10L15/06 ; G10L19/04

摘要：

本申请实施例公开了语音信号生成方法和装置。该方法的一具体实施方式包括：获取待转换为语音信号的合成文本；采用已训练的参数合成模型对合成文本对应的语音信号的声学特征和所包含的各语音状态的状态时长信息进行预测，声学特征包括基频信息和频谱特征；将预测出的声学特征和状态时长信息输入已训练的语音信号生成模型，输出合成文本对应的语音信号；语音信号生成模型是基于参数合成模型对第一样本语音库中的第一样本语音信号所包含的各语音状态的状态时长信息和第一样本语音信号的频谱特征的预测结果、以及从第一样本语音信号中提取出的基频信息训练得出的；参数合成模型是基于第二样本语音库训练得出的。该实施方式提升了合成语音的质量。

公开/授权文献

CN108182936A 语音信号生成方法和装置公开/授权日：2018-06-19

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L13/00	语音合成；文本-语音合成系统
G10L13/02	.产生合成语音的方法；语音合成设备