-
公开(公告)号:CN107680580B
公开(公告)日:2020-08-18
申请号:CN201710901952.4
申请日:2017-09-28
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 陈汉英
Abstract: 本申请公开了文本转换模型训练方法和装置、文本转换方法和装置。该文本转换模型训练方法的一具体实施方式包括:将输入文本对应的输入字符序列中的字符依次输入待生成的文本转换模型对应的神经网络中,文本转换模型对应的神经网络包括编码器和解码器;对输入字符序列中的每个字符,基于解码器中的隐藏层在对输入的上一个字符解码后的状态,采用编码器进行编码,得到字符的中间语义向量,并采用解码器对中间语义向量进行解译,得到字符的预测结果;根据输入字符序列的预测结果与输入文本对应的标注结果之间的差异,对神经网络的参数进行调整。该实施方式得到的文本转换模型可以实现文本正则化和多音字的联合预测,减小了资源维护成本。
-
公开(公告)号:CN107680580A
公开(公告)日:2018-02-09
申请号:CN201710901952.4
申请日:2017-09-28
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 陈汉英
Abstract: 本申请公开了文本转换模型训练方法和装置、文本转换方法和装置。该文本转换模型训练方法的一具体实施方式包括:将输入文本对应的输入字符序列中的字符依次输入待生成的文本转换模型对应的神经网络中,文本转换模型对应的神经网络包括编码器和解码器;对输入字符序列中的每个字符,基于解码器中的隐藏层在对输入的上一个字符解码后的状态,采用编码器进行编码,得到字符的中间语义向量,并采用解码器对中间语义向量进行解译,得到字符的预测结果;根据输入字符序列的预测结果与输入文本对应的标注结果之间的差异,对神经网络的参数进行调整。该实施方式得到的文本转换模型可以实现文本正则化和多音字的联合预测,减小了资源维护成本。
-
公开(公告)号:CN107705784A
公开(公告)日:2018-02-16
申请号:CN201710897187.3
申请日:2017-09-28
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 陈汉英
Abstract: 本申请公开了文本正则化模型训练方法和装置、文本正则化方法和装置。该文本正则化模型训练方法的一具体实施方式包括:将输入文本对应的输入字符序列中的字符依次输入待生成的文本正则化模型对应的神经网络中,文本正则化模型对应的神经网络包括编码器和解码器;对输入字符序列中的每个字符,基于解码器中的隐藏层在对输入的上一个字符解码后的状态,采用编码器进行编码,得到字符的中间语义向量,并采用解码器对中间语义向量进行解译,得到字符的预测结果;根据输入字符序列的预测结果与输入文本对应的标注结果之间的差异,对神经网络的参数进行调整。该实施方式实现了文本正则化模型的自动化训练,提升了文本正则化模型的灵活性和准确性。
-
公开(公告)号:CN105355193B
公开(公告)日:2020-09-25
申请号:CN201510728762.8
申请日:2015-10-30
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种语音合成方法和装置,该语音合成方法包括:获取以段落或篇章为单位的文本数据;在发音人朗读所述文本数据时进行录制,得到所述文本数据对应的语音数据,其中,发音人在朗读时结合文本数据的语义进行个人情感表达;生成韵律模型,以及,根据所述文本数据和所述语音数据生成声学模型;在需要进行语音合成时,根据预先生成的韵律模型和声学模型对输入文本进行处理,得到所述输入文本对应的合成语音。该方法能够提高合成语音的情感表现力。
-
公开(公告)号:CN107680579A
公开(公告)日:2018-02-09
申请号:CN201710912134.4
申请日:2017-09-29
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 陈汉英
Abstract: 本申请公开了文本正则化模型训练方法和装置、文本正则化方法和装置。该模型训练方法的一具体实施方式包括:将输入文本对应的输入字符序列中的输入字符依次输入文本正则化模型对应的循环神经网络中,其中输入文本对应的输入字符序列按照如下方式生成:按照第一预设粒度对输入文本进行分割得到第一分割结果;将第一分割结果中的具有至少两种正则化结果的非汉字字符进行标签化处理;基于循环神经网络对各输入字符进行分类,得到输入字符序列的预测分类结果;根据输入字符序列的预测分类结果与输入文本的正则化文本的标注分类结果之间的差异,对神经网络的参数进行调整;该实施方式实现了文本正则化模型的自动化训练,提升了文本正则化模型的灵活性。
-
公开(公告)号:CN105118499A
公开(公告)日:2015-12-02
申请号:CN201510391903.1
申请日:2015-07-06
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G10L13/086 , G06N99/005 , G10L13/10 , G10L15/14 , G10L15/1807
Abstract: 本发明提出一种韵律停顿预测方法和装置,其中,该方法包括以下步骤:基于机器学习方法获取待预测的文本内容对应的停顿预测结果,并根据预设的句式模板库对文本内容进行句式匹配,以确定文本内容对应的韵律停顿信息;根据韵律停顿信息对停顿预测结果进行修正;根据修正后的停顿预测结果对文本内容进行韵律停顿预测。本发明的韵律停顿预测方法,能够对机器学习方法的预测结果进行补充和修正,提升韵律预测结果的可靠性。
-
公开(公告)号:CN107705784B
公开(公告)日:2020-09-29
申请号:CN201710897187.3
申请日:2017-09-28
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 陈汉英
IPC: G10L13/04 , G06N3/08 , G06N3/04 , G06F40/30 , G06F40/279
Abstract: 本申请公开了文本正则化模型训练方法和装置、文本正则化方法和装置。该文本正则化模型训练方法的一具体实施方式包括:将输入文本对应的输入字符序列中的字符依次输入待生成的文本正则化模型对应的神经网络中,文本正则化模型对应的神经网络包括编码器和解码器;对输入字符序列中的每个字符,基于解码器中的隐藏层在对输入的上一个字符解码后的状态,采用编码器进行编码,得到字符的中间语义向量,并采用解码器对中间语义向量进行解译,得到字符的预测结果;根据输入字符序列的预测结果与输入文本对应的标注结果之间的差异,对神经网络的参数进行调整。该实施方式实现了文本正则化模型的自动化训练,提升了文本正则化模型的灵活性和准确性。
-
公开(公告)号:CN107680579B
公开(公告)日:2020-08-14
申请号:CN201710912134.4
申请日:2017-09-29
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 陈汉英
IPC: G10L13/04 , G06F40/30 , G06F40/279 , G06N3/04 , G06N3/08
Abstract: 本申请公开了文本正则化模型训练方法和装置、文本正则化方法和装置。该模型训练方法的一具体实施方式包括:将输入文本对应的输入字符序列中的输入字符依次输入文本正则化模型对应的循环神经网络中,其中输入文本对应的输入字符序列按照如下方式生成:按照第一预设粒度对输入文本进行分割得到第一分割结果;将第一分割结果中的具有至少两种正则化结果的非汉字字符进行标签化处理;基于循环神经网络对各输入字符进行分类,得到输入字符序列的预测分类结果;根据输入字符序列的预测分类结果与输入文本的正则化文本的标注分类结果之间的差异,对神经网络的参数进行调整;该实施方式实现了文本正则化模型的自动化训练,提升了文本正则化模型的灵活性。
-
公开(公告)号:CN105355193A
公开(公告)日:2016-02-24
申请号:CN201510728762.8
申请日:2015-10-30
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种语音合成方法和装置,该语音合成方法包括:获取以段落或篇章为单位的文本数据;在发音人朗读所述文本数据时进行录制,得到所述文本数据对应的语音数据,其中,发音人在朗读时结合文本数据的语义进行个人情感表达;生成韵律模型,以及,根据所述文本数据和所述语音数据生成声学模型;在需要进行语音合成时,根据预先生成的韵律模型和声学模型对输入文本进行处理,得到所述输入文本对应的合成语音。该方法能够提高合成语音的情感表现力。
-
-
-
-
-
-
-
-