Patent search ap:("百度在线网络技术(北京)有限公司") AND inv:"陈智鹏" Page 1

1.

发明公开
语音合成模型的训练方法、装置、电子设备及存储介质有权

公开(公告)号：CN110619867A

公开(公告)日：2019-12-27

申请号：CN201910927040.3

申请日：2019-09-27

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 陈智鹏 , 白锦峰 , 贾磊

IPC: G10L13/02 , G10L13/08 , G06N3/08

Abstract: 本申请公开了语音合成模型的训练方法、装置、电子设备及存储介质，涉及计算机智能语音领域。具体实现方案为：将当前样本的音节输入序列、音素输入序列和汉字输入序列作为待训练模型的编码器的输入，在编码器的输出端得到各个序列的编码表示；将编码表示的三个序列进行融合，得到三个序列的一个加权组合；将该加权组合作为注意力模块的输入，在注意力模块的输出端得到音节输入序列、音素输入序列和汉字输入序列的加权组合在各个时刻上的加权平均；将该加权平均作为待训练模型的解码器的输入，在解码器的输出端得到当前样本的语音Mel谱输出。本申请实施例可以有效地改善发音效果，为语音产品提供高表现力和高自然度的中文合成语音。

2.

发明公开
语音识别方法和装置有权

公开(公告)号：CN108877782A

公开(公告)日：2018-11-23

申请号：CN201810726721.9

申请日：2018-07-04

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 白锦峰 , 陈智鹏

IPC: G10L15/08 , G10L15/06 , G10L15/00

Abstract: 本申请实施例公开了语音识别方法和装置。该方法的一具体实施方式包括：获取语音，将该语音输入预先训练的声学模型，基于该声学模型的输出，得到语音识别结果；以及该声学模型的构建步骤包括：确定预设的语料库中语音的标注文本的发音单元，得到该标注文本的发音单元序列；对该发音单元序列中的至少两个相邻的发音单元进行组合，生成包含组合的语音的标注序列；基于各个语音的标注序列，训练得到该声学模型。本申请实施例能够增强声学模型对包括不同语言的语音的识别能力，提高声学模型的准确性。

3.

发明授权
语音识别方法和装置有权

公开(公告)号：CN108877782B

公开(公告)日：2020-09-11

申请号：CN201810726721.9

申请日：2018-07-04

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 白锦峰 , 陈智鹏

IPC: G10L15/08 , G10L15/06 , G10L15/00

Abstract: 本申请实施例公开了语音识别方法和装置。该方法的一具体实施方式包括：获取语音，将该语音输入预先训练的声学模型，基于该声学模型的输出，得到语音识别结果；以及该声学模型的构建步骤包括：确定预设的语料库中语音的标注文本的发音单元，得到该标注文本的发音单元序列；对该发音单元序列中的至少两个相邻的发音单元进行组合，生成包含组合的语音的标注序列；基于各个语音的标注序列，训练得到该声学模型。本申请实施例能够增强声学模型对包括不同语言的语音的识别能力，提高声学模型的准确性。

4.

发明授权
语音合成模型的训练方法、装置、电子设备及存储介质有权

公开(公告)号：CN110619867B

公开(公告)日：2020-11-03

申请号：CN201910927040.3

申请日：2019-09-27

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 陈智鹏 , 白锦峰 , 贾磊

IPC: G10L13/02 , G10L13/08 , G06N3/08

Abstract: 本申请公开了语音合成模型的训练方法、装置、电子设备及存储介质，涉及计算机智能语音领域。具体实现方案为：将当前样本的音节输入序列、音素输入序列和汉字输入序列作为待训练模型的编码器的输入，在编码器的输出端得到各个序列的编码表示；将编码表示的三个序列进行融合，得到三个序列的一个加权组合；将该加权组合作为注意力模块的输入，在注意力模块的输出端得到音节输入序列、音素输入序列和汉字输入序列的加权组合在各个时刻上的加权平均；将该加权平均作为待训练模型的解码器的输入，在解码器的输出端得到当前样本的语音Mel谱输出。本申请实施例可以有效地改善发音效果，为语音产品提供高表现力和高自然度的中文合成语音。

Patent Agency Ranking