-
公开(公告)号:CN107103903B
公开(公告)日:2020-05-29
申请号:CN201710312689.5
申请日:2017-05-05
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明公开了基于人工智能的声学模型训练方法、装置及存储介质,其中方法包括:获取人工标注的语音数据;根据人工标注的语音数据训练得到第一声学模型;获取未标注的语音数据;根据未标注的语音数据以及第一声学模型训练得到所需的第二声学模型。应用本发明所述方案,能够节省人力成本,并提高训练效率等。
-
公开(公告)号:CN106601228B
公开(公告)日:2020-02-04
申请号:CN201611135605.7
申请日:2016-12-09
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/10
Abstract: 本发明提出一种基于人工智能韵律预测的样本标注方法及装置,其中,方法包括:获取与第一样本音频文件对应的未标注韵律的第一文本序列;获取第一文本序列中每个字的文本特征和发音时长;应用预先训练的韵律标注模型对第一文本序列中每个字的文本特征和发音时长,获取第一文本序列中每个字的输出标记;根据第一文本序列中每个字的输出标记对第一文本序列进行韵律层级标注。由此,降低了文本的标注成本,提高了文本的标注效率和准确性,并能够提供更多的韵律层级标注所需的训练样本,提高韵律标注模型性能,使得语音合成效果更加自然。
-
公开(公告)号:CN107240395A
公开(公告)日:2017-10-10
申请号:CN201710458720.6
申请日:2017-06-16
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/06
Abstract: 本发明实施例公开了一种声学模型训练方法和装置、计算机设备、存储介质,其中方法包括:获取有监督语音数据和无监督语音数据,其中,有监督语音数据为带有人工标注的语音数据,无监督语音数据为带有机器标注的语音数据;从所述有监督语音数据和无监督语音数据中提取语音特征;利用深度学习的网络结构,对所述有监督语音数据和无监督语音数据的语音特征分别进行有监督学习任务和无监督学习任务的多任务学习,以训练并获得声学模型。本发明实施例基于多任务学习的半监督声学模型训练,节省了声学模型训练所需的人工标注语音数据的成本,也无需购买价格昂贵的人工标注语音数据,并且可以持续提升语音识别的性能。
-
公开(公告)号:CN107103903A
公开(公告)日:2017-08-29
申请号:CN201710312689.5
申请日:2017-05-05
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明公开了基于人工智能的声学模型训练方法、装置及存储介质,其中方法包括:获取人工标注的语音数据;根据人工标注的语音数据训练得到第一声学模型;获取未标注的语音数据;根据未标注的语音数据以及第一声学模型训练得到所需的第二声学模型。应用本发明所述方案,能够节省人力成本,并提高训练效率等。
-
公开(公告)号:CN106992007A
公开(公告)日:2017-07-28
申请号:CN201710193915.2
申请日:2017-03-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种基于语音识别打分系统的数据处理方法和装置,该基于语音识别打分系统的数据处理方法包括获取多个线程中,每个线程待处理的数据帧,得到多帧数据;对多帧数据进行拼帧处理,并将拼帧处理后的数据帧作为目标数据帧;从多个线程中确定目标线程,并基于目标线程对目标数据帧进行处理。通过本发明能够提升基于语音识别打分系统的数据处理效率,节省处理逻辑所消耗的系统资源。
-
公开(公告)号:CN106601228A
公开(公告)日:2017-04-26
申请号:CN201611135605.7
申请日:2016-12-09
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/10
Abstract: 本发明提出一种基于人工智能韵律预测的样本标注方法及装置,其中,方法包括:获取与第一样本音频文件对应的未标注韵律的第一文本序列;获取第一文本序列中每个字的文本特征和发音时长;应用预先训练的韵律标注模型对第一文本序列中每个字的文本特征和发音时长,获取第一文本序列中每个字的输出标记;根据第一文本序列中每个字的输出标记对第一文本序列进行韵律层级标注。由此,降低了文本的标注成本,提高了文本的标注效率和准确性,并能够提供更多的韵律层级标注所需的训练样本,提高韵律标注模型性能,使得语音合成效果更加自然。
-
公开(公告)号:CN107240395B
公开(公告)日:2020-04-28
申请号:CN201710458720.6
申请日:2017-06-16
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/06
Abstract: 本发明实施例公开了一种声学模型训练方法和装置、计算机设备、存储介质,其中方法包括:获取有监督语音数据和无监督语音数据,其中,有监督语音数据为带有人工标注的语音数据,无监督语音数据为带有机器标注的语音数据;从所述有监督语音数据和无监督语音数据中提取语音特征;利用深度学习的网络结构,对所述有监督语音数据和无监督语音数据的语音特征分别进行有监督学习任务和无监督学习任务的多任务学习,以训练并获得声学模型。本发明实施例基于多任务学习的半监督声学模型训练,节省了声学模型训练所需的人工标注语音数据的成本,也无需购买价格昂贵的人工标注语音数据,并且可以持续提升语音识别的性能。
-
公开(公告)号:CN105336322B
公开(公告)日:2017-05-10
申请号:CN201510641654.7
申请日:2015-09-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/08
Abstract: 本发明公开了一种用于语音合成的多音字模型训练方法、语音合成方法及装置,其中,该方法包括:对语音数据集合和文本集合进行处理,以生成训练语料集合,其中,文本集合与语音数据集合对应,训练语料集合包括文本和与文本对应的拼音序列;提取文本的特征信息;以及根据特征信息和拼音序列对多音字模型进行训练。上述用于语音合成的多音字模型训练方法,在训练多音字模型的过程中,无需人工对文本的拼音进行标注,大大减少了多音字模型的训练周期,同时,避免了由人工标注错误而造成训练的多音字模型不准确情况的发生,提高了所训练的多音字模型的准确性。
-
公开(公告)号:CN106992007B
公开(公告)日:2020-07-28
申请号:CN201710193915.2
申请日:2017-03-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种基于语音识别打分系统的数据处理方法和装置,该基于语音识别打分系统的数据处理方法包括获取多个线程中,每个线程待处理的数据帧,得到多帧数据;对多帧数据进行拼帧处理,并将拼帧处理后的数据帧作为目标数据帧;从多个线程中确定目标线程,并基于目标线程对目标数据帧进行处理。通过本发明能够提升基于语音识别打分系统的数据处理效率,节省处理逻辑所消耗的系统资源。
-
公开(公告)号:CN105336322A
公开(公告)日:2016-02-17
申请号:CN201510641654.7
申请日:2015-09-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/08
CPC classification number: G10L13/08
Abstract: 本发明公开了一种用于语音合成的多音字模型训练方法、语音合成方法及装置,其中,该方法包括:对语音数据集合和文本集合进行处理,以生成训练语料集合,其中,文本集合与语音数据集合对应,训练语料集合包括文本和与文本对应的拼音序列;提取文本的特征信息;以及根据特征信息和拼音序列对多音字模型进行训练。上述用于语音合成的多音字模型训练方法,在训练多音字模型的过程中,无需人工对文本的拼音进行标注,大大减少了多音字模型的训练周期,同时,避免了由人工标注错误而造成训练的多音字模型不准确情况的发生,提高了所训练的多音字模型的准确性。
-
-
-
-
-
-
-
-
-