-
公开(公告)号:CN110807331B
公开(公告)日:2022-07-01
申请号:CN201911017931.1
申请日:2019-10-24
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/30 , G06F40/205 , G06F16/35 , G06N3/08
Abstract: 本申请公开了一种多音字读音预测方法、装置和电子设备,涉及语音技术领域。具体实现方案为:通过多头自注意力语言模型对输入文本进行语义解析,以得到所述输入文本的文本语义信息;依据所述文本语义信息预测所述输入文本中多音字的读音。本申请可以提高预测多音字读音的准确性。
-
公开(公告)号:CN104866472B
公开(公告)日:2017-10-27
申请号:CN201510329109.4
申请日:2015-06-15
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/27
Abstract: 本发明提出一种分词训练集的生成方法和装置,该分词训练集的生成方法包括获取训练语料,并采用不同的分词器分别对相同的训练语料进行分词,得到对应不同分词器的分词结果;将所述分词结果划分为精确匹配的分词结果和非精确匹配的分词结果;根据所述分词结果,对所述非精确匹配的分词结果进行降噪处理,得到分词训练集。该方法能够降低分词训练集生成的时间和花费,实现成本降低及效果提高。
-
公开(公告)号:CN105096933B
公开(公告)日:2017-06-20
申请号:CN201510289231.3
申请日:2015-05-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/027 , G10L13/06 , G06F17/27 , G06F17/30
Abstract: 本发明提出一种分词词典的生成方法和装置及语音合成方法和装置,该分词词典的生成方法包括对收集的预设范围内的文本进行划分,得到组成所述文本的句子;对所述句子进行划分,得到不同长度的字符串;根据所述不同长度的字符串,确定不同长度的字符串内的可信词条;根据所述可信词条建立分词词典。该方法能够获取与相应领域适合的分词词典,进而可以提高分词效果,提高语音合成效果。
-
公开(公告)号:CN105336322A
公开(公告)日:2016-02-17
申请号:CN201510641654.7
申请日:2015-09-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/08
CPC classification number: G10L13/08
Abstract: 本发明公开了一种用于语音合成的多音字模型训练方法、语音合成方法及装置,其中,该方法包括:对语音数据集合和文本集合进行处理,以生成训练语料集合,其中,文本集合与语音数据集合对应,训练语料集合包括文本和与文本对应的拼音序列;提取文本的特征信息;以及根据特征信息和拼音序列对多音字模型进行训练。上述用于语音合成的多音字模型训练方法,在训练多音字模型的过程中,无需人工对文本的拼音进行标注,大大减少了多音字模型的训练周期,同时,避免了由人工标注错误而造成训练的多音字模型不准确情况的发生,提高了所训练的多音字模型的准确性。
-
公开(公告)号:CN104866472A
公开(公告)日:2015-08-26
申请号:CN201510329109.4
申请日:2015-06-15
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/27
Abstract: 本发明提出一种分词训练集的生成方法和装置,该分词训练集的生成方法包括获取训练语料,并采用不同的分词器分别对相同的训练语料进行分词,得到对应不同分词器的分词结果;将所述分词结果划分为精确匹配的分词结果和非精确匹配的分词结果;根据所述分词结果,对所述非精确匹配的分词结果进行降噪处理,得到分词训练集。该方法能够降低分词训练集生成的时间和花费,实现成本降低及效果提高。
-
公开(公告)号:CN104899190B
公开(公告)日:2017-10-03
申请号:CN201510301079.6
申请日:2015-06-04
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/27
Abstract: 本发明提出一种分词词典的生成方法和装置及分词处理方法和装置,该分词词典的生成方法包括获取原始句语料;对所述原始句语料进行切分,得到分词,并对所述分词进行过滤,得到过滤结果,所述过滤包括如下项中的至少一项:基于词频和逆频率的过滤,基于边界的过滤,基于拼接的过滤;根据所述过滤结果生成分词词典。该方法能够不依赖人工筛选和分词器,可以识别未登录的词条,从而提高分词词典的生成速度和效果。
-
公开(公告)号:CN110941945A
公开(公告)日:2020-03-31
申请号:CN201911214094.1
申请日:2019-12-02
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/126 , G06F40/284
Abstract: 本申请公开了语言模型预训练方法和装置。该方法的一具体实施方式包括:获取初始语言模型,初始语言模型用于确定输入到初始语言模型的文本数据中包含的字之间的关联关系;获取训练初始语言模型的训练样本集,训练样本集中的训练样本包括样本数据、第一标注信息和第二标注信息;将样本数据作为输入,将第一标注信息作为与初始语言模型的第一输出端连接的初始去噪自编码模型的期望输出,并将第二标注信息作为与初始语言模型的第二输出端连接的初始序列到序列模型的期望输出,对初始语言模型、初始去噪自编码模型和初始序列到序列模型进行预训练,得到训练后的语言模型。该实施方式可以显示捕获文本的音韵信息,有效提升了语言模型输出文本的语义表示效果。
-
公开(公告)号:CN105489216B
公开(公告)日:2020-03-03
申请号:CN201610034930.8
申请日:2016-01-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/02 , H04L12/721
Abstract: 本发明公开了一种语音合成系统的优化方法和装置,其中,语音合成系统的优化方法包括:接收包含文本信息的语音合成请求;确定在接收到语音合成请求时语音合成系统的负载等级;以及选择与负载等级对应的语音合成路径,并根据语音合成路径对文本信息进行语音合成。本发明实施例的语音合成系统的优化方法和装置,通过接收包含文本信息的语音合成请求,并确定在接收到语音合成请求时语音合成系统的负载等级,以及选择与负载等级对应的语音合成路径,并根据语音合成路径对文本信息进行语音合成,能够根据语音合成系统的负载等级弹性地选择相应的语音合成路径,从而实现语音合成,为用户提供更加稳定的服务,避免延时情况的发生,提升用户使用体验。
-
公开(公告)号:CN104992703B
公开(公告)日:2017-10-03
申请号:CN201510441079.6
申请日:2015-07-24
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/02
CPC classification number: G10L13/02
Abstract: 本发明提出一种语音合成方法和系统,该语音合成方法包括:在需要语音合成时,从服务端查询可用音库列表,所述可用音库列表中包括多个可用音库的信息,所述可用音库包括特色音库;获取用户根据所述可用音库列表选择的音库,并从服务端下载用户选择的音库;采用下载的音库,将文本合成为语音。该方法能够降低离线语音合成APP的体积,并且可以为用户提供更多选择,实现个性化语音合成。
-
公开(公告)号:CN104992704B
公开(公告)日:2017-06-20
申请号:CN201510417099.X
申请日:2015-07-15
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G10L13/047 , G10L13/07 , G10L13/08
Abstract: 本发明提出一种语音合成方法和装置,该语音合成方法包括:对文本进行处理,获得待合成文本;当存在网络连接时,将所述待合成文本发送给在线语音合成系统进行语音合成;如果在所述在线语音合成系统进行语音合成的过程中,所述在线语音合成系统出现故障或者实际使用过程中网络连接中断,则将所述在线语音合成系统未完成语音合成的文本发送给离线语音合成系统进行语音合成。本发明结合在线语音合成与离线语音合成的优点,可以提供更稳定、效果更自然的语音合成服务,保证了用户的语音合成请求总是可以顺利地完成,提高了用户对语音合成服务的认可度和用户体验度。
-
-
-
-
-
-
-
-
-