-
公开(公告)号:CN110289010A
公开(公告)日:2019-09-27
申请号:CN201910521230.5
申请日:2019-06-17
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L21/0264 , G10L21/0216 , G10L25/60 , G10L13/04
Abstract: 本发明提供了一种声音采集的方法、装置、设备和计算机存储介质,其中方法包括:声音采集装置播放预设的语音片段的同时,采集第一声音数据;采集用户对所述语音片段的跟读声音数据;利用声音干扰系数对所述跟读声音数据进行去干扰处理,得到第二声音数据,其中所述声音干扰系数是利用所述语音片段和所述第一声音数据确定的;利用所述第二声音数据,得到用于语音合成的训练数据。通过本发明提供的方式能够提高采集的声音数据的质量。
-
公开(公告)号:CN110797005B
公开(公告)日:2022-06-10
申请号:CN201911072965.0
申请日:2019-11-05
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/10 , G10L13/08 , G06F40/289 , G06N20/00
Abstract: 本申请实施例公开了一种韵律预测方法、装置、设备和介质,涉及数据处理领域,尤其涉及语音合成技术。该方法包括:对待预测的中英混合文本进行切分,得到中文文本和英文文本;确定中文文本中文字的字向量和英文文本中单词的词向量;根据确定的字向量和词向量,确定所述中英混合文本的韵律预测结果。本申请实施例提供了一种韵律预测方法、装置、设备和介质,提高了对中英混合文本的韵律预测准确率。
-
公开(公告)号:CN110782871B
公开(公告)日:2020-10-30
申请号:CN201911046827.5
申请日:2019-10-30
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了一种韵律停顿预测方法、装置以及电子设备,涉及机器学习技术领域。具体实现方案为:基于已训练的嵌入层对待测文本序列进行映射,得到第一矩阵,其中,待测文本序列包括待测输入文本以及待测发音人的身份标识;将所述第一矩阵输入已训练的注意力模型中,基于所述已训练的注意力模型确定语义表示矩阵;基于所述语义表示矩阵进行韵律停顿预测,输出所述待测文本序列中每个文字的韵律停顿预测结果。
-
公开(公告)号:CN107608970B
公开(公告)日:2024-04-26
申请号:CN201710910875.9
申请日:2017-09-29
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 卞衍尧
IPC: G06F40/205 , G06F40/284 , G06N3/0442 , G06N3/084
Abstract: 本申请公开了词性标注模型生成方法和装置。该方法的一具体实施方式包括:利用用于生成词语对应的词向量的神经网络生成用于训练的语句中的每一个词语对应的词向量;基于生成的所述语句中的每一个词语对应的词向量,基于预测出的所述语句中的每一个词语的词性和每一个词语的标注的词性,调整所述对词性标注模型对应的神经网络的参数。一方面,对词性标注模型对应的神经网络进行训练的开销为以字粒度特征进行的训练的开销,同时,具有诸如保证同一个词内的所有字都预测为同一个词性的利用词粒度特征进行训练的优点。另一方面,最终得到的词性标注模型占用的存储空间小,使得词性标注模型可以应用于嵌入式系统中。
-
公开(公告)号:CN110797005A
公开(公告)日:2020-02-14
申请号:CN201911072965.0
申请日:2019-11-05
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/10 , G10L13/08 , G06F40/289 , G06N20/00
Abstract: 本申请实施例公开了一种韵律预测方法、装置、设备和介质,涉及数据处理领域,尤其涉及语音合成技术。该方法包括:对待预测的中英混合文本进行切分,得到中文文本和英文文本;确定中文文本中文字的字向量和英文文本中单词的词向量;根据确定的字向量和词向量,确定所述中英混合文本的韵律预测结果。本申请实施例提供了一种韵律预测方法、装置、设备和介质,提高了对中英混合文本的韵律预测准确率。
-
公开(公告)号:CN110782871A
公开(公告)日:2020-02-11
申请号:CN201911046827.5
申请日:2019-10-30
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了一种韵律停顿预测方法、装置以及电子设备,涉及机器学习技术领域。具体实现方案为:基于已训练的嵌入层对待测文本序列进行映射,得到第一矩阵,其中,待测文本序列包括待测输入文本以及待测发音人的身份标识;将所述第一矩阵输入已训练的注意力模型中,基于所述已训练的注意力模型确定语义表示矩阵;基于所述语义表示矩阵进行韵律停顿预测,输出所述待测文本序列中每个文字的韵律停顿预测结果。
-
公开(公告)号:CN110289010B
公开(公告)日:2020-10-30
申请号:CN201910521230.5
申请日:2019-06-17
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L21/0264 , G10L21/0216 , G10L25/60 , G10L13/04
Abstract: 本发明提供了一种声音采集的方法、装置、设备和计算机存储介质,其中方法包括:声音采集装置播放预设的语音片段的同时,采集第一声音数据;采集用户对所述语音片段的跟读声音数据;利用声音干扰系数对所述跟读声音数据进行去干扰处理,得到第二声音数据,其中所述声音干扰系数是利用所述语音片段和所述第一声音数据确定的;利用所述第二声音数据,得到用于语音合成的训练数据。通过本发明提供的方式能够提高采集的声音数据的质量。
-
公开(公告)号:CN110880198A
公开(公告)日:2020-03-13
申请号:CN201811037239.0
申请日:2018-09-06
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06T13/40
Abstract: 本申请实施例公开了动画生成方法和装置。所述方法的一实施例包括:响应于接收到输入文本,获取输入文本的动画标签,并得到输入文本中的词和动作之间的对应关系;生成与输入文本对应的语音;将基于所得到的对应关系对预设的人物形象的模型进行渲染生成的视频和所生成的语音合并,生成人物形象的动画。该实现方式可以使得生成的动画中,人物形象的动作能够自然而准确地体现输入文本所表达的含义。
-
公开(公告)号:CN107608970A
公开(公告)日:2018-01-19
申请号:CN201710910875.9
申请日:2017-09-29
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 卞衍尧
Abstract: 本申请公开了词性标注模型生成方法和装置。该方法的一具体实施方式包括:利用用于生成词语对应的词向量的神经网络生成用于训练的语句中的每一个词语对应的词向量;基于生成的所述语句中的每一个词语对应的词向量,基于预测出的所述语句中的每一个词语的词性和每一个词语的标注的词性,调整所述对词性标注模型对应的神经网络的参数。一方面,对词性标注模型对应的神经网络进行训练的开销为以字粒度特征进行的训练的开销,同时,具有诸如保证同一个词内的所有字都预测为同一个词性的利用词粒度特征进行训练的优点。另一方面,最终得到的词性标注模型占用的存储空间小,使得词性标注模型可以应用于嵌入式系统中。
-
-
-
-
-
-
-
-