声音转换模型的训练方法、电子设备及存储介质

发明授权

CN112802462B 声音转换模型的训练方法、电子设备及存储介质有权

请登陆查看更多内容

专利标题： 声音转换模型的训练方法、电子设备及存储介质
申请号： CN202011627564.X

申请日： 2020-12-31
公开(公告)号： CN112802462B

公开(公告)日： 2024-05-31
发明人: 陈言年 , 刘利娟 , 胡亚军 , 江源
申请人： 科大讯飞股份有限公司
申请人地址： 安徽省合肥市高新开发区望江西路666号
专利权人： 科大讯飞股份有限公司
当前专利权人： 科大讯飞股份有限公司
当前专利权人地址： 安徽省合肥市高新开发区望江西路666号
代理机构： 深圳市威世博知识产权代理事务所
代理商 何倚雯
主分类号： G10L15/16
IPC分类号： G10L15/16 ; G10L25/18 ; G10L25/24 ; G10L13/02

摘要：

本申请公开了一种声音转换模型的训练方法、电子设备及存储介质。该方法包括：从第一语音数据集中获取第一训练语音数据，其中，第一语音数据集中包括目标说话人的多条语音数据，第一训练语音数据对应第一声学特征；获取第一声学特征对应的后验概率特征；将第一声学特征对应的后验概率特征和第一辅助音色特征输入声音转换模型，得到第一平行特征；获取第一平行特征对应的后验概率特征；将第一平行特征对应的后验概率特征和目标音色特征输入声音转换模型，得到第二声学特征；基于第二声学特征和第一声学特征之间的差异，调整声音转换模型的参数。通过上述方式，能够提高声音转换模型的转换效果。

公开/授权文献

CN112802462A 声音转换模型的训练方法、电子设备及存储介质公开/授权日：2021-05-14

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）
G10L15/08	.语音分类或检索
G10L15/16	..利用人工神经网络