语音合成中时长参数的生成方法

    公开(公告)号:CN102222501B

    公开(公告)日:2012-11-07

    申请号:CN201110160419.X

    申请日:2011-06-15

    Inventor: 陶建华 潘诗锋

    Abstract: 本发明涉及一种语音合成中时长参数的生成方法,用于基于隐马尔可夫模型的语音合成中进行状态时长参数的生成,对于输入的上下文相关隐马尔可夫模型序列生成各模型的各个状态的时长,即各状态的驻留时间,在生成状态时长参数时结合了隐马尔可夫模型中的状态时长模型和时长整体方差模型。创建时长整体方差模型训练语料库,利用时长整体方差分析器从训练语料库中生成时长整体方差训练样本,利用整体方差训练样本训练时长整体方差模型。本发明较好的克服了基于隐马尔可夫模型的语音合成中生成的状态时长参数过于平均的问题,合成结果在时长分布上更加自然、具有表现力。

    音频数据的编码方法及解码方法

    公开(公告)号:CN103035238A

    公开(公告)日:2013-04-10

    申请号:CN201210487489.0

    申请日:2012-11-27

    Abstract: 本发明提供了一种音频数据的编码方法和解码方法。该编码方法包括:获取原始音频,通过短时能量和短时过零率进行端点检测,剔除原始音频中的非音频数据,获得语音段数据;从语音段数据提取特征参数,通过已训练的隐马尔科夫模型和Viterbi算法,对每帧语音段数据进行状态识别,确定状态序列和状态时长;以及对状态序列和状态时长进行编码,生成音频数据包。本发明可以在低编码速率的情况下,保持较高的语音音质。

    语音合成中时长参数的生成方法

    公开(公告)号:CN102222501A

    公开(公告)日:2011-10-19

    申请号:CN201110160419.X

    申请日:2011-06-15

    Inventor: 陶建华 潘诗锋

    Abstract: 本发明涉及一种语音合成中时长参数的生成方法,用于基于隐马尔可夫模型的语音合成中进行状态时长参数的生成,对于输入的上下文相关隐马尔可夫模型序列生成各模型的各个状态的时长,即各状态的驻留时间,在生成状态时长参数时结合了隐马尔可夫模型中的状态时长模型和时长整体方差模型。创建时长整体方差模型训练语料库,利用时长整体方差分析器从训练语料库中生成时长整体方差训练样本,利用整体方差训练样本训练时长整体方差模型。本发明较好的克服了基于隐马尔可夫模型的语音合成中生成的状态时长参数过于平均的问题,合成结果在时长分布上更加自然、具有表现力。

    音频数据的编码方法及解码方法

    公开(公告)号:CN103035238B

    公开(公告)日:2014-09-17

    申请号:CN201210487489.0

    申请日:2012-11-27

    Abstract: 本发明提供了一种音频数据的编码方法和解码方法。该编码方法包括:获取原始音频,通过短时能量和短时过零率进行端点检测,剔除原始音频中的非音频数据,获得语音段数据;从语音段数据提取特征参数,通过已训练的隐马尔科夫模型和Viterbi算法,对每帧语音段数据进行状态识别,确定状态序列和状态时长;以及对状态序列和状态时长进行编码,生成音频数据包。本发明可以在低编码速率的情况下,保持较高的语音音质。

Patent Agency Ranking