发明授权
- 专利标题: 语音信号生成方法和装置
-
申请号: CN201810209741.9申请日: 2018-03-14
-
公开(公告)号: CN108182936B公开(公告)日: 2019-05-03
- 发明人: 顾宇 , 康永国
- 申请人: 百度在线网络技术(北京)有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦三层
- 专利权人: 百度在线网络技术(北京)有限公司
- 当前专利权人: 百度在线网络技术(北京)有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦三层
- 代理机构: 北京英赛嘉华知识产权代理有限责任公司
- 代理商 王达佐; 马晓亚
- 主分类号: G10L13/02
- IPC分类号: G10L13/02 ; G10L15/02 ; G10L15/06 ; G10L19/04
摘要:
本申请实施例公开了语音信号生成方法和装置。该方法的一具体实施方式包括:获取待转换为语音信号的合成文本;采用已训练的参数合成模型对合成文本对应的语音信号的声学特征和所包含的各语音状态的状态时长信息进行预测,声学特征包括基频信息和频谱特征;将预测出的声学特征和状态时长信息输入已训练的语音信号生成模型,输出合成文本对应的语音信号;语音信号生成模型是基于参数合成模型对第一样本语音库中的第一样本语音信号所包含的各语音状态的状态时长信息和第一样本语音信号的频谱特征的预测结果、以及从第一样本语音信号中提取出的基频信息训练得出的;参数合成模型是基于第二样本语音库训练得出的。该实施方式提升了合成语音的质量。
公开/授权文献
- CN108182936A 语音信号生成方法和装置 公开/授权日:2018-06-19