Patent search ap:("百度在线网络技术(北京)有限公司") AND inv:"吴本谷" Page 1

1.

发明授权
声纹注册、认证方法及装置有权

公开(公告)号：CN105933323B

公开(公告)日：2019-05-31

申请号：CN201610384014.7

申请日：2016-06-01

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 李超 , 吴本谷

IPC: H04L29/06 , G10L15/02 , G10L17/00

Abstract: 本发明公开了一种声纹注册、认证方法及装置，其中注册方法包括：对用户语音输入的注册字符串进行帧对齐，提取每个字符的声学特征；将每个字符的声学特征在全局GMM模型中计算后验概率进行BW统计；通过预设的多个字符的矢量特征提取器分别提取每个字符的矢量特征；将所有字符的矢量特征进行顺序拼接，获取用户的注册声纹模型。通过该发明实施例，分别对注册字符串中的各字符进行特征处理，提高声纹注册模型的准确性。

2.

发明授权
声纹注册、认证方法及装置有权

公开(公告)号：CN106100846B

公开(公告)日：2019-05-03

申请号：CN201610389161.3

申请日：2016-06-02

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 吴本谷 , 李超 , 关勇

IPC: H04L9/32 , H04L29/06

Abstract: 本发明公开了一种声纹注册、认证方法及装置。其中，方法包括：分别提取与用户输入的N句注册语料对应的多种类型的声纹特征，其中，N大于1；融合多种类型的声纹特征，建立用户的注册声纹模型。该方法通过融合多种类型的声纹特征建立注册声纹模型，提高了通过注册声纹模型认证用户的合法性的可靠性和精确度。

3.

发明公开
声纹注册、认证方法及装置有权

公开(公告)号：CN105933323A

公开(公告)日：2016-09-07

申请号：CN201610384014.7

申请日：2016-06-01

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 李超 , 吴本谷

IPC: H04L29/06 , G10L15/02 , G10L17/00

Abstract: 本发明公开了一种声纹注册、认证方法及装置，其中注册方法包括：对用户语音输入的注册字符串进行帧对齐，提取每个字符的声学特征；将每个字符的声学特征在全局GMM模型中计算后验概率进行BW统计；通过预设的多个字符的矢量特征提取器分别提取每个字符的矢量特征；将所有字符的矢量特征进行顺序拼接，获取用户的注册声纹模型。通过该发明实施例，分别对注册字符串中的各字符进行特征处理，提高声纹注册模型的准确性。

4.

发明公开
基于深度学习的声纹认证方法和装置无效

公开(公告)号：CN105869644A

公开(公告)日：2016-08-17

申请号：CN201610353878.2

申请日：2016-05-25

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 吴本谷 , 李超 , 关勇

IPC: G10L17/04 , G10L17/02

CPC classification number: G10L17/02 , G10L17/04 , G10L17/08 , G10L17/18

Abstract: 本发明提出一种基于深度学习的声纹认证方法和装置，该基于深度学习的声纹认证方法包括：接收说话人的语音；提取所述语音的d?vector特征；获取所述说话人在注册阶段确定的d?vector特征；计算上述两个d?vector特征之间的匹配值；如果所述匹配值大于或等于阈值，则确定所述说话人通过认证。该方法能够提高声纹认证的效果。

5.

发明公开
声纹认证处理方法及装置有权

公开(公告)号：CN105513597A

公开(公告)日：2016-04-20

申请号：CN201511024873.7

申请日：2015-12-30

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 李超 , 吴本谷 , 朱林

IPC: G10L17/00 , G10L17/04 , G10L15/02 , G10L15/06 , H04L29/06

CPC classification number: G10L17/18 , G10L17/04 , G10L17/00 , G10L15/02 , G10L15/063 , H04L63/0861

Abstract: 本申请提出一种声纹认证处理方法和装置，其中，该方法包括：应用混合性别的深度神经网络DNN声纹基线系统，提取训练集中每条语音的第一特征向量；根据所述每条语音的第一特征向量以及预先标注的性别标签训练性别分类器；根据所述训练集中不同性别的语音数据，分别训练不同性别的DNN模型；根据不同性别的DNN模型以及所述训练集中不同性别的语音数据，分别训练不同性别的统一背景模型、特征向量提取模型、以及概率线性判别分析模型。建立了区分性别的声纹认证处理模型，以便提高了声纹认证的效率和准确性。

6.

发明公开
UBM分字模型的建立方法、声纹特征生成方法及装置有权

公开(公告)号：CN106128464A

公开(公告)日：2016-11-16

申请号：CN201610409454.3

申请日：2016-06-12

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 李超 , 吴本谷

IPC: G10L17/02 , G10L17/04 , G10L25/27 , G06F21/41

CPC classification number: G10L17/02 , G06F21/41 , G10L17/04 , G10L25/27

Abstract: 本发明公开了一种通用背景模型UBM分字模型的建立方法、基于该UBM分字模型的声纹特征生成方法以及装置。其中UBM分字模型的建立方法包括：提取训练语音的声学特征，并对训练语音进行语音识别以获取训练语音中的各个字符；从训练语音的声学特征中确定各个字符的声学特征；针对每个字符，分别对每个字符的声学特征进行训练以建立对应的UBM分字模型；针对每个字符，分别根据每个字符的声学特征以及对应的UBM分字模型生成对应的声纹特征提取器。该方法分别为每个字符单独建立一个对应的UBM分字模型以及声纹特征提取器，可以获得更加精确的Baum‑Welch统计量，进而可以得到精确的声纹模型。

7.

发明公开
基于人工智能的声纹认证方法以及装置无效

公开(公告)号：CN105656887A

公开(公告)日：2016-06-08

申请号：CN201511020415.6

申请日：2015-12-30

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 李超 , 李骁 , 吴本谷

IPC: H04L29/06

CPC classification number: G10L17/22 , G06F16/686 , G06N5/022 , G06N7/005 , G06N20/10 , G06N20/20 , G10L17/04 , G10L17/06 , G10L17/24 , H04L63/0861 , G10L17/00 , H04L63/0807 , H04L63/0815 , H04L63/083 , H04L65/1073

Abstract: 本发明公开了一种基于人工智能的声纹认证方法以及装置，其中，该方法包括：接收用户的注册请求，并将注册字符串提供至用户；接收用户阅读注册字符串的语音信息，并根据语音信息生成N段语音，其中，N为正整数；根据性别分类模型和N段语音确定用户的性别标签；以及根据性别标签和N段语音生成用户的注册声纹模型。实现了在注册的过程中，通过先获取该用户的性别标签，之后根据该性别标签使用不同的模型以生成对应的注册声纹模型，使得在登录时提高了声纹密码作为认证手段的可用性，提高了声纹匹配的性能，并使得用户通过语音即可完成注册，简化了用户的操作步骤。

8.

发明授权
声纹认证处理方法及装置有权

公开(公告)号：CN105513597B

公开(公告)日：2018-07-10

申请号：CN201511024873.7

申请日：2015-12-30

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 李超 , 吴本谷 , 朱林

IPC: G10L17/00 , G10L17/04 , G10L15/02 , G10L15/06 , H04L29/06

CPC classification number: G10L17/18 , G10L17/04

Abstract: 本申请提出一种声纹认证处理方法和装置，其中，该方法包括：应用混合性别的深度神经网络DNN声纹基线系统，提取训练集中每条语音的第一特征向量；根据所述每条语音的第一特征向量以及预先标注的性别标签训练性别分类器；根据所述训练集中不同性别的语音数据，分别训练不同性别的DNN模型；根据不同性别的DNN模型以及所述训练集中不同性别的语音数据，分别训练不同性别的统一背景模型、特征向量提取模型、以及概率线性判别分析模型。建立了区分性别的声纹认证处理模型，以便提高了声纹认证的效率和准确性。

9.

发明公开
声纹注册、认证方法及装置有权

公开(公告)号：CN106100846A

公开(公告)日：2016-11-09

申请号：CN201610389161.3

申请日：2016-06-02

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 吴本谷 , 李超 , 关勇

IPC: H04L9/32 , H04L29/06

CPC classification number: H04L63/0861 , H04L9/3231

Abstract: 本发明公开了一种声纹注册、认证方法及装置。其中，方法包括：分别提取与用户输入的N句注册语料对应的多种类型的声纹特征，其中，N大于1；融合多种类型的声纹特征，建立用户的注册声纹模型。该方法通过融合多种类型的声纹特征建立注册声纹模型，提高了通过注册声纹模型认证用户的合法性的可靠性和精确度。

10.

发明授权
UBM分字模型的建立方法、声纹特征生成方法及装置有权

公开(公告)号：CN106128464B

公开(公告)日：2019-05-31

申请号：CN201610409454.3

申请日：2016-06-12

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 李超 , 吴本谷

IPC: G06F21/32 , G10L17/02 , G10L17/04 , G10L25/27

Abstract: 本发明公开了一种通用背景模型UBM分字模型的建立方法、基于该UBM分字模型的声纹特征生成方法以及装置。其中UBM分字模型的建立方法包括：提取训练语音的声学特征，并对训练语音进行语音识别以获取训练语音中的各个字符；从训练语音的声学特征中确定各个字符的声学特征；针对每个字符，分别对每个字符的声学特征进行训练以建立对应的UBM分字模型；针对每个字符，分别根据每个字符的声学特征以及对应的UBM分字模型生成对应的声纹特征提取器。该方法分别为每个字符单独建立一个对应的UBM分字模型以及声纹特征提取器，可以获得更加精确的Baum‑Welch统计量，进而可以得到精确的声纹模型。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification