- 专利标题: 声音转换模型的训练方法、电子设备及存储介质
-
申请号: CN202011627564.X申请日: 2020-12-31
-
公开(公告)号: CN112802462B公开(公告)日: 2024-05-31
- 发明人: 陈言年 , 刘利娟 , 胡亚军 , 江源
- 申请人: 科大讯飞股份有限公司
- 申请人地址: 安徽省合肥市高新开发区望江西路666号
- 专利权人: 科大讯飞股份有限公司
- 当前专利权人: 科大讯飞股份有限公司
- 当前专利权人地址: 安徽省合肥市高新开发区望江西路666号
- 代理机构: 深圳市威世博知识产权代理事务所
- 代理商 何倚雯
- 主分类号: G10L15/16
- IPC分类号: G10L15/16 ; G10L25/18 ; G10L25/24 ; G10L13/02
摘要:
本申请公开了一种声音转换模型的训练方法、电子设备及存储介质。该方法包括:从第一语音数据集中获取第一训练语音数据,其中,第一语音数据集中包括目标说话人的多条语音数据,第一训练语音数据对应第一声学特征;获取第一声学特征对应的后验概率特征;将第一声学特征对应的后验概率特征和第一辅助音色特征输入声音转换模型,得到第一平行特征;获取第一平行特征对应的后验概率特征;将第一平行特征对应的后验概率特征和目标音色特征输入声音转换模型,得到第二声学特征;基于第二声学特征和第一声学特征之间的差异,调整声音转换模型的参数。通过上述方式,能够提高声音转换模型的转换效果。
公开/授权文献
- CN112802462A 声音转换模型的训练方法、电子设备及存储介质 公开/授权日:2021-05-14