情感语音合成方法和装置

    公开(公告)号:CN102005205B

    公开(公告)日:2012-10-03

    申请号:CN200910170713.1

    申请日:2009-09-03

    Inventor: 栾剑 李健

    Abstract: 本发明提供了情感语音合成方法和装置。根据本发明的一个方面,提供了一种情感语音合成方法,包括以下步骤:输入文本句;利用由第一说话人的中立语音库训练获得的中立特征模型,预测上述文本句在上述第一说话人的第一特征空间中的中立特征向量;利用由上述中立语音库和第二说话人的平行语音库训练获得的说话人规整模型,将上述中立特征向量变换为上述第二说话人的第二特征空间中的规整中立特征向量;利用由上述平行语音库训练获得的情感转换模型,将上述规整中立特征向量转换为上述第二特征空间中的规整情感特征向量;利用上述说话人规整模型,将上述规整情感特征向量逆变换为上述第一特征空间中的情感特征向量;以及利用上述第一特征空间中的情感特征向量合成出第一说话人的情感语音。

    用于合成语音的方法、设备以及用于语音合成的声学模型训练方法

    公开(公告)号:CN102651217A

    公开(公告)日:2012-08-29

    申请号:CN201110046580.4

    申请日:2011-02-25

    Inventor: 汪曦 楼晓雁 李健

    CPC classification number: G10L13/08

    Abstract: 本发明涉及一种用于合成语音的方法、设备以及用于训练在语音合成中使用的声学模型的方法。所述用于合成语音的方法可以包括:确定文本分析生成的数据为模糊多音字数据;对所述模糊多音字数据进行模糊多音字预测,以输出所述模糊多音字数据的多个候选发音及其概率;基于所述多个候选发音及其概率,生成模糊上下文特征标注;基于具有模糊决策树的声学模型,针对所述模糊上下文特征标注确定模型参数;对所述模型参数生成语音参数;以及将所述语音参数合成为语音。根据本发明的实施例的方法和设备,可以对中文中难以预测的多音字进行模糊化处理,从而改善中文多音字合成的质量。

    测量语速的方法和装置以及录音设备

    公开(公告)号:CN1841496A

    公开(公告)日:2006-10-04

    申请号:CN200510059832.1

    申请日:2005-03-31

    Abstract: 本发明提供了测量语速的方法、测量语速的装置和录音设备。本发明的测量语速的方法,包括:输入记录有语音的语音信息;从上述语音信息中识别音素序列和每个音素对应的时间分割点;根据上述识别出的音素序列和每个音素对应的时间分割点,识别字序列和每个字对应的时间分割点;以及根据上述识别出的字序列和每个字相应的时间分割点,计算上述语音的语速。采用本实施例的测量语速的方法,可以自动地测量出一段语音的语速,而不需要在录音后期由人工测量语速。

    用于合成语音的方法和装置

    公开(公告)号:CN103854643A

    公开(公告)日:2014-06-11

    申请号:CN201210501075.9

    申请日:2012-11-29

    Inventor: 康永国 李健

    Abstract: 本发明提供用于合成语音的方法和装置。所述用于合成语音的装置,包括:输入单元,其输入文本句;文本分析单元,其对上述文本句进行文本分析以获得音素序列;查找单元,其在时长预测模型中的时长决策树中查找上述音素序列中的至少一个音素的叶子节点,上述叶子节点中的音素时长实例被聚为多个类;概率计算单元,其计算上述至少一个音素属于上述叶子节点中的多个类的每个类的概率;时长预测单元,其利用上述概率计算单元计算出的概率和上述多个类的每个类的类中心时长预测上述至少一个音素的时长;以及语音合成单元,其利用上述时长预测单元预测出的时长合成上述文本句的语音。

    合成语音的方法和装置
    5.
    发明公开

    公开(公告)号:CN102203853A

    公开(公告)日:2011-09-28

    申请号:CN201080000927.5

    申请日:2010-01-04

    Inventor: 汪曦 栾剑 李健

    CPC classification number: G10L13/02 G10L19/018

    Abstract: 本发明提供了合成语音的方法和装置。根据本发明的一个方面,提供了一种合成带有信息的语音的装置,包括:输入单元,其输入文本句;文本分析单元,其对上述输入单元输入的文本句进行文本分析,以提取语言学信息;参数生成单元,其利用上述文本分析单元提取的语言学信息和预先训练好的统计参数模型,生成语音参数;嵌入单元,其在上述语音参数中嵌入预定的信息;以及语音合成单元,其将利用上述嵌入单元嵌入了上述信息的上述语音参数合成为带有上述信息的语音。

    合成语音的方法和装置
    6.
    发明授权

    公开(公告)号:CN102203853B

    公开(公告)日:2013-02-27

    申请号:CN201080000927.5

    申请日:2010-01-04

    Inventor: 汪曦 栾剑 李健

    CPC classification number: G10L13/02 G10L19/018

    Abstract: 本发明提供了合成语音的方法和装置。根据本发明的一个方面,提供了一种合成带有信息的语音的装置,包括:输入单元,其输入文本句;文本分析单元,其对上述输入单元输入的文本句进行文本分析,以提取语言学信息;参数生成单元,其利用上述文本分析单元提取的语言学信息和预先训练好的统计参数模型,生成语音参数;嵌入单元,其在上述语音参数中嵌入预定的信息;以及语音合成单元,其将利用上述嵌入单元嵌入了上述信息的上述语音参数合成为带有上述信息的语音。

    在语音合成中用于融合浊音音素单元的方法和装置

    公开(公告)号:CN102511061A

    公开(公告)日:2012-06-20

    申请号:CN201080001520.4

    申请日:2010-06-28

    Inventor: 栾剑 李健

    CPC classification number: G10L13/06

    Abstract: 本发明提供了在语音合成中用于融合浊音音素单元的方法和装置。本发明的一种用于融合浊音音素单元的装置包括:单元输入模块,其输入用于目标片段的浊音音素的多个单元;单元切分模块,其对多个单元的每个单元进行切分以获得每个单元的基音周期;参考单元选择模块,其基于每个单元的基音周期信息和目标片段的基音周期个数从多个单元中选择一个参考单元;模板创建模块,其基于参考单元和目标片段的基音周期个数创建一个模板;基音周期对齐模块,其利用动态规划算法将多个单元的除了参考单元的每个单元的基音周期与模板的基音周期对齐;基音周期融合模块,其将对齐的基音周期融合;以及基音周期拼接模块,其将融合的基音周期拼接为目标片段的融合单元。

    情感语音合成方法和装置

    公开(公告)号:CN102005205A

    公开(公告)日:2011-04-06

    申请号:CN200910170713.1

    申请日:2009-09-03

    Inventor: 栾剑 李健

    Abstract: 本发明提供了情感语音合成方法和装置。根据本发明的一个方面,提供了一种情感语音合成方法,包括以下步骤:输入文本句;利用由第一说话人的中立语音库训练获得的中立特征模型,预测上述文本句在上述第一说话人的第一特征空间中的中立特征向量;利用由上述中立语音库和第二说话人的平行语音库训练获得的说话人规整模型,将上述中立特征向量变换为上述第二说话人的第二特征空间中的规整中立特征向量;利用由上述平行语音库训练获得的情感转换模型,将上述规整中立特征向量转换为上述第二特征空间中的规整情感特征向量;利用上述说话人规整模型,将上述规整情感特征向量逆变换为上述第一特征空间中的情感特征向量;以及利用上述第一特征空间中的情感特征向量合成出第一说话人的情感语音。

    韵律自适应及语音合成的方法和装置

    公开(公告)号:CN101452699A

    公开(公告)日:2009-06-10

    申请号:CN200710197104.6

    申请日:2007-12-04

    CPC classification number: G10L13/08

    Abstract: 本发明提供数据驱动训练差分韵律自适应模型、生成差分韵律自适应模型、韵律预测和语音合成的方法及装置。该数据驱动训练差分韵律自适应模型的方法包括:用时长和基频的正交多项式的系数表示差分韵律向量;对于差分韵律向量中的每一个参数,利用与差分韵律预测相关的多个属性和这些属性的组合生成初始参数预测模型,其中每个属性或上述属性的组合被作为一项;计算参数预测模型的每一项的重要性;删除所计算的重要性最低的项;利用剩余的项重新生成参数预测模型;判断重新生成的参数预测模型是否最优;如果参数预测模型不是最优,则重复上述计算每一项的重要性的步骤及其之后的步骤;其中差分韵律向量及其全部参数预测模型构成差分韵律自适应模型。

Patent Agency Ranking