-
公开(公告)号:CN105355193A
公开(公告)日:2016-02-24
申请号:CN201510728762.8
申请日:2015-10-30
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种语音合成方法和装置,该语音合成方法包括:获取以段落或篇章为单位的文本数据;在发音人朗读所述文本数据时进行录制,得到所述文本数据对应的语音数据,其中,发音人在朗读时结合文本数据的语义进行个人情感表达;生成韵律模型,以及,根据所述文本数据和所述语音数据生成声学模型;在需要进行语音合成时,根据预先生成的韵律模型和声学模型对输入文本进行处理,得到所述输入文本对应的合成语音。该方法能够提高合成语音的情感表现力。
-
公开(公告)号:CN109616100B
公开(公告)日:2022-06-24
申请号:CN201910005075.1
申请日:2019-01-03
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明公开了一种语音识别模型的生成方法及其装置。其中,方法包括:获取多种环境下的噪声信号,以及无噪声的样本语音信号。根据多种环境下的噪声信号和无噪声的样本语音信号,生成多种带噪声的样本语音信号。使用样本语音信号,对深度神经网络进行训练,以生成语音识别模型。其中,样本语音信号包括多种带噪声的样本语音信号和无噪声的样本语音信号。由此,实现了使用不同的样本语音信号对深度神经网络进行训练,以生成能够应对不同环境噪声的语音识别模型,增强了语音识别模型的鲁棒性。解决了现有技术中不能对不同环境下的噪声进行处理的技术问题。
-
公开(公告)号:CN105355193B
公开(公告)日:2020-09-25
申请号:CN201510728762.8
申请日:2015-10-30
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种语音合成方法和装置,该语音合成方法包括:获取以段落或篇章为单位的文本数据;在发音人朗读所述文本数据时进行录制,得到所述文本数据对应的语音数据,其中,发音人在朗读时结合文本数据的语义进行个人情感表达;生成韵律模型,以及,根据所述文本数据和所述语音数据生成声学模型;在需要进行语音合成时,根据预先生成的韵律模型和声学模型对输入文本进行处理,得到所述输入文本对应的合成语音。该方法能够提高合成语音的情感表现力。
-
公开(公告)号:CN106601228B
公开(公告)日:2020-02-04
申请号:CN201611135605.7
申请日:2016-12-09
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/10
Abstract: 本发明提出一种基于人工智能韵律预测的样本标注方法及装置,其中,方法包括:获取与第一样本音频文件对应的未标注韵律的第一文本序列;获取第一文本序列中每个字的文本特征和发音时长;应用预先训练的韵律标注模型对第一文本序列中每个字的文本特征和发音时长,获取第一文本序列中每个字的输出标记;根据第一文本序列中每个字的输出标记对第一文本序列进行韵律层级标注。由此,降低了文本的标注成本,提高了文本的标注效率和准确性,并能够提供更多的韵律层级标注所需的训练样本,提高韵律标注模型性能,使得语音合成效果更加自然。
-
公开(公告)号:CN107729313A
公开(公告)日:2018-02-23
申请号:CN201710876713.8
申请日:2017-09-25
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06F17/2765 , G06N3/08
Abstract: 本申请提出一种基于深度神经网络的多音字读音的判别方法和装置,其中,上述基于深度神经网络的多音字读音的判别方法包括:对待识别文本中的每个汉字进行量化编码,生成所述汉字的特征向量;根据汉字的特征向量,结合所述汉字的双方向的上下文信息,生成汉字的输入特征;将所述汉字的输入特征分别输入声母、韵母和声调对应的DNN模型,分别获得第一概率、第二概率和第三概率;根据第一概率、第二概率和第三概率计算声母、韵母和声调的各种组合的概率,以概率最高的组合作为所述汉字的读音。本申请可以提高读音判别的准确性,有效缓解多音字高频音引起的训练样本不均衡的问题,并且可以解决多个多音字的读音判别问题,有利于语音合成系统的集成。
-
公开(公告)号:CN104867491B
公开(公告)日:2017-08-18
申请号:CN201510337430.7
申请日:2015-06-17
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/10
Abstract: 本发明公开了一种用于语音合成的韵律模型训练方法和装置,其中,用于语音合成的韵律模型训练方法,包括:S1、从训练语料文本中提取分词对应的文本特征和标记特征;S2、基于同义词词林对训练语料文本中的分词进行泛化;以及S3、根据文本特征、标记特征以及泛化后的分词,对韵律模型进行训练。本发明实施例的用于语音合成的韵律模型训练方法和装置,通过从训练语料文本中提取分词对应的文本特征和标记特征,基于同义词词林对训练语料文本中的多个分词进行泛化,然后根据文本特征、标记特征以及泛化后的分词,对韵律模型进行训练,使得韵律模型更加完善,进而提升韵律预测的准确性。
-
公开(公告)号:CN106601228A
公开(公告)日:2017-04-26
申请号:CN201611135605.7
申请日:2016-12-09
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/10
Abstract: 本发明提出一种基于人工智能韵律预测的样本标注方法及装置,其中,方法包括:获取与第一样本音频文件对应的未标注韵律的第一文本序列;获取第一文本序列中每个字的文本特征和发音时长;应用预先训练的韵律标注模型对第一文本序列中每个字的文本特征和发音时长,获取第一文本序列中每个字的输出标记;根据第一文本序列中每个字的输出标记对第一文本序列进行韵律层级标注。由此,降低了文本的标注成本,提高了文本的标注效率和准确性,并能够提供更多的韵律层级标注所需的训练样本,提高韵律标注模型性能,使得语音合成效果更加自然。
-
-
-
-
-
-