发明授权
CN102005205B 情感语音合成方法和装置
失效 - 权利终止
- 专利标题: 情感语音合成方法和装置
- 专利标题(英): Emotional speech synthesizing method and device
-
申请号: CN200910170713.1申请日: 2009-09-03
-
公开(公告)号: CN102005205B公开(公告)日: 2012-10-03
- 发明人: 栾剑 , 李健
- 申请人: 株式会社东芝
- 申请人地址: 日本东京都
- 专利权人: 株式会社东芝
- 当前专利权人: 株式会社东芝
- 当前专利权人地址: 日本东京都
- 代理机构: 北京市中咨律师事务所
- 代理商 于静; 刘瑞东
- 主分类号: G10L13/02
- IPC分类号: G10L13/02 ; G10L13/04
摘要:
本发明提供了情感语音合成方法和装置。根据本发明的一个方面,提供了一种情感语音合成方法,包括以下步骤:输入文本句;利用由第一说话人的中立语音库训练获得的中立特征模型,预测上述文本句在上述第一说话人的第一特征空间中的中立特征向量;利用由上述中立语音库和第二说话人的平行语音库训练获得的说话人规整模型,将上述中立特征向量变换为上述第二说话人的第二特征空间中的规整中立特征向量;利用由上述平行语音库训练获得的情感转换模型,将上述规整中立特征向量转换为上述第二特征空间中的规整情感特征向量;利用上述说话人规整模型,将上述规整情感特征向量逆变换为上述第一特征空间中的情感特征向量;以及利用上述第一特征空间中的情感特征向量合成出第一说话人的情感语音。
公开/授权文献
- CN102005205A 情感语音合成方法和装置 公开/授权日:2011-04-06