-
公开(公告)号:CN110619867A
公开(公告)日:2019-12-27
申请号:CN201910927040.3
申请日:2019-09-27
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了语音合成模型的训练方法、装置、电子设备及存储介质,涉及计算机智能语音领域。具体实现方案为:将当前样本的音节输入序列、音素输入序列和汉字输入序列作为待训练模型的编码器的输入,在编码器的输出端得到各个序列的编码表示;将编码表示的三个序列进行融合,得到三个序列的一个加权组合;将该加权组合作为注意力模块的输入,在注意力模块的输出端得到音节输入序列、音素输入序列和汉字输入序列的加权组合在各个时刻上的加权平均;将该加权平均作为待训练模型的解码器的输入,在解码器的输出端得到当前样本的语音Mel谱输出。本申请实施例可以有效地改善发音效果,为语音产品提供高表现力和高自然度的中文合成语音。
-
公开(公告)号:CN108877782A
公开(公告)日:2018-11-23
申请号:CN201810726721.9
申请日:2018-07-04
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了语音识别方法和装置。该方法的一具体实施方式包括:获取语音,将该语音输入预先训练的声学模型,基于该声学模型的输出,得到语音识别结果;以及该声学模型的构建步骤包括:确定预设的语料库中语音的标注文本的发音单元,得到该标注文本的发音单元序列;对该发音单元序列中的至少两个相邻的发音单元进行组合,生成包含组合的语音的标注序列;基于各个语音的标注序列,训练得到该声学模型。本申请实施例能够增强声学模型对包括不同语言的语音的识别能力,提高声学模型的准确性。
-
公开(公告)号:CN108877782B
公开(公告)日:2020-09-11
申请号:CN201810726721.9
申请日:2018-07-04
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了语音识别方法和装置。该方法的一具体实施方式包括:获取语音,将该语音输入预先训练的声学模型,基于该声学模型的输出,得到语音识别结果;以及该声学模型的构建步骤包括:确定预设的语料库中语音的标注文本的发音单元,得到该标注文本的发音单元序列;对该发音单元序列中的至少两个相邻的发音单元进行组合,生成包含组合的语音的标注序列;基于各个语音的标注序列,训练得到该声学模型。本申请实施例能够增强声学模型对包括不同语言的语音的识别能力,提高声学模型的准确性。
-
公开(公告)号:CN110619867B
公开(公告)日:2020-11-03
申请号:CN201910927040.3
申请日:2019-09-27
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了语音合成模型的训练方法、装置、电子设备及存储介质,涉及计算机智能语音领域。具体实现方案为:将当前样本的音节输入序列、音素输入序列和汉字输入序列作为待训练模型的编码器的输入,在编码器的输出端得到各个序列的编码表示;将编码表示的三个序列进行融合,得到三个序列的一个加权组合;将该加权组合作为注意力模块的输入,在注意力模块的输出端得到音节输入序列、音素输入序列和汉字输入序列的加权组合在各个时刻上的加权平均;将该加权平均作为待训练模型的解码器的输入,在解码器的输出端得到当前样本的语音Mel谱输出。本申请实施例可以有效地改善发音效果,为语音产品提供高表现力和高自然度的中文合成语音。
-
-
-