一种语音信号合成方法、装置、电子设备及存储介质

发明公开

CN117153142A 一种语音信号合成方法、装置、电子设备及存储介质审中-实审

请登陆查看更多内容

专利标题： 一种语音信号合成方法、装置、电子设备及存储介质
申请号： CN202311101067.X

申请日： 2023-08-29
公开(公告)号： CN117153142A

公开(公告)日： 2023-12-01
发明人: 梁小明 , 何金鑫 , 张毅 , 孙宇嘉 , 王紫烟 , 付振 , 王明月
申请人： 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
申请人地址： 吉林省长春市汽车经济技术开发区新红旗大街1号
专利权人： 中国第一汽车股份有限公司,一汽(南京)科技开发有限公司
当前专利权人： 中国第一汽车股份有限公司,一汽(南京)科技开发有限公司
当前专利权人地址： 吉林省长春市汽车经济技术开发区新红旗大街1号
代理机构： 北京远智汇知识产权代理有限公司
代理商 高学锋
主分类号： G10L13/02
IPC分类号： G10L13/02 ; G10L13/047

摘要：

本发明公开了一种语音信号合成方法、装置、电子设备及存储介质。该方法包括：对输入文本进行正则化处理；将输入文本输入至经过训练的多任务模型；通过声学模型，根据音素序列和韵律结构特征的拼接结果预测语音的声音成分；通过声码器基于声音成分合成语音信号。上述技术方案，通过多任务模型基于指令集将输入文本转换为对应的韵律结构特征和音素序列，最后通过声学模型和声码器将音素序列和韵律结构特征合成语音信号，避免了为每个任务单独构建多任务模型，从而降低了多任务模型的复杂度，增强了文本转音素的精度和质量，提高了语音信号合成的处理效率和准确性，有助于在多语言场景中更加准确地预测出语音信号合成中的发音信息。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L13/00	语音合成；文本-语音合成系统
G10L13/02	.产生合成语音的方法；语音合成设备