-
公开(公告)号:CN110797005B
公开(公告)日:2022-06-10
申请号:CN201911072965.0
申请日:2019-11-05
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/10 , G10L13/08 , G06F40/289 , G06N20/00
Abstract: 本申请实施例公开了一种韵律预测方法、装置、设备和介质,涉及数据处理领域,尤其涉及语音合成技术。该方法包括:对待预测的中英混合文本进行切分,得到中文文本和英文文本;确定中文文本中文字的字向量和英文文本中单词的词向量;根据确定的字向量和词向量,确定所述中英混合文本的韵律预测结果。本申请实施例提供了一种韵律预测方法、装置、设备和介质,提高了对中英混合文本的韵律预测准确率。
-
公开(公告)号:CN110782871B
公开(公告)日:2020-10-30
申请号:CN201911046827.5
申请日:2019-10-30
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了一种韵律停顿预测方法、装置以及电子设备,涉及机器学习技术领域。具体实现方案为:基于已训练的嵌入层对待测文本序列进行映射,得到第一矩阵,其中,待测文本序列包括待测输入文本以及待测发音人的身份标识;将所述第一矩阵输入已训练的注意力模型中,基于所述已训练的注意力模型确定语义表示矩阵;基于所述语义表示矩阵进行韵律停顿预测,输出所述待测文本序列中每个文字的韵律停顿预测结果。
-
公开(公告)号:CN110941945A
公开(公告)日:2020-03-31
申请号:CN201911214094.1
申请日:2019-12-02
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/126 , G06F40/284
Abstract: 本申请公开了语言模型预训练方法和装置。该方法的一具体实施方式包括:获取初始语言模型,初始语言模型用于确定输入到初始语言模型的文本数据中包含的字之间的关联关系;获取训练初始语言模型的训练样本集,训练样本集中的训练样本包括样本数据、第一标注信息和第二标注信息;将样本数据作为输入,将第一标注信息作为与初始语言模型的第一输出端连接的初始去噪自编码模型的期望输出,并将第二标注信息作为与初始语言模型的第二输出端连接的初始序列到序列模型的期望输出,对初始语言模型、初始去噪自编码模型和初始序列到序列模型进行预训练,得到训练后的语言模型。该实施方式可以显示捕获文本的音韵信息,有效提升了语言模型输出文本的语义表示效果。
-
公开(公告)号:CN110797005A
公开(公告)日:2020-02-14
申请号:CN201911072965.0
申请日:2019-11-05
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/10 , G10L13/08 , G06F40/289 , G06N20/00
Abstract: 本申请实施例公开了一种韵律预测方法、装置、设备和介质,涉及数据处理领域,尤其涉及语音合成技术。该方法包括:对待预测的中英混合文本进行切分,得到中文文本和英文文本;确定中文文本中文字的字向量和英文文本中单词的词向量;根据确定的字向量和词向量,确定所述中英混合文本的韵律预测结果。本申请实施例提供了一种韵律预测方法、装置、设备和介质,提高了对中英混合文本的韵律预测准确率。
-
公开(公告)号:CN110782871A
公开(公告)日:2020-02-11
申请号:CN201911046827.5
申请日:2019-10-30
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了一种韵律停顿预测方法、装置以及电子设备,涉及机器学习技术领域。具体实现方案为:基于已训练的嵌入层对待测文本序列进行映射,得到第一矩阵,其中,待测文本序列包括待测输入文本以及待测发音人的身份标识;将所述第一矩阵输入已训练的注意力模型中,基于所述已训练的注意力模型确定语义表示矩阵;基于所述语义表示矩阵进行韵律停顿预测,输出所述待测文本序列中每个文字的韵律停顿预测结果。
-
公开(公告)号:CN111061868B
公开(公告)日:2023-05-23
申请号:CN201911069834.7
申请日:2019-11-05
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/35 , G06F18/2411 , G06F18/214
Abstract: 本申请公开了读法预测模型获取及读法预测方法、装置及存储介质,涉及深度学习领域,其中的读法预测模型获取方法可包括:利用第一训练样本集训练得到语言模型,语言模型中至少包含两层多头注意力层;利用语言模型及分类器构成读法预测模型,并利用第二训练样本集训练读法预测模型,以便针对待预测的输入文本,预测出其中的预定类型字符的读法分类。应用本申请所述方案,可提升预测结果的准确性等。
-
公开(公告)号:CN110941945B
公开(公告)日:2021-03-23
申请号:CN201911214094.1
申请日:2019-12-02
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/126 , G06F40/284
Abstract: 本申请公开了语言模型预训练方法和装置。该方法的一具体实施方式包括:获取初始语言模型,初始语言模型用于确定输入到初始语言模型的文本数据中包含的字之间的关联关系;获取训练初始语言模型的训练样本集,训练样本集中的训练样本包括样本数据、第一标注信息和第二标注信息;将样本数据作为输入,将第一标注信息作为与初始语言模型的第一输出端连接的初始去噪自编码模型的期望输出,并将第二标注信息作为与初始语言模型的第二输出端连接的初始序列到序列模型的期望输出,对初始语言模型、初始去噪自编码模型和初始序列到序列模型进行预训练,得到训练后的语言模型。该实施方式可以显示捕获文本的音韵信息,有效提升了语言模型输出文本的语义表示效果。
-
公开(公告)号:CN111061868A
公开(公告)日:2020-04-24
申请号:CN201911069834.7
申请日:2019-11-05
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了读法预测模型获取及读法预测方法、装置及存储介质,涉及深度学习领域,其中的读法预测模型获取方法可包括:利用第一训练样本集训练得到语言模型,语言模型中至少包含两层多头注意力层;利用语言模型及分类器构成读法预测模型,并利用第二训练样本集训练读法预测模型,以便针对待预测的输入文本,预测出其中的预定类型字符的读法分类。应用本申请所述方案,可提升预测结果的准确性等。
-
-
-
-
-
-
-