Patent search ap:("百度在线网络技术(北京)有限公司") AND inv:"苏丹" Page 2

11.

发明授权
语音识别的建模方法和装置有权

公开(公告)号：CN105551483B

公开(公告)日：2020-02-04

申请号：CN201510920809.0

申请日：2015-12-11

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 白锦峰 , 苏丹 , 胡娜 , 贾磊

IPC: G10L15/06

Abstract: 本发明提出一种语音识别的建模方法和装置，上述语音识别的建模方法包括：将语音信号转化成特征向量序列，以及将所述语音信号对应的标注文本转化成建模单元序列，所述建模单元序列中的每个建模单元为完整的声母或韵母的发音单元或者上下文相关的声母或韵母的发音单元；在所述建模单元序列中的任意建模单元的前面或后面添加空白标签；基于连接时序分类对所述特征向量序列和添加所述空白标签后的建模单元序列进行训练，建立语音识别模型。本发明基于CTC的深度循环神经网络的声韵母建模，提高了建立的语音识别模型的识别速度和识别准确率。

12.

发明授权
一种声纹验证方法和装置有权

公开(公告)号：CN104468522B

公开(公告)日：2017-10-03

申请号：CN201410643064.3

申请日：2014-11-07

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 苏丹 , 关勇

IPC: H04L29/06 , H04L9/32 , G10L17/00

CPC classification number: H04L63/0861 , G06F3/04883 , G06F3/04886 , G06F3/167 , G06F21/36 , H04L63/0838

Abstract: 本发明公开了一种声纹验证方法和装置，所述方法包括：客户端生成并显示具有固定标识符的各键盘元素的随机标识符，以使用户通过输入至少一个键盘元素的随机标识符的声音信号来设定密码；客户端接收用户在设定密码时输入的第一声音信号，将第一声音信号传输给服务端。服务端接收客户端发送的用户在设定密码时输入的第一声音信号；服务端从第一声音信号中提取至少一个随机标识符，其中每个随机标识符分别对应一个具有固定标识符的键盘元素；服务端确定提取出的各随机标识符分别对应的键盘元素的固定标识符，并根据确定的固定标识符确定并保存用户设定的密码。通过上述方法，避免了现有技术中固定密码可见的问题，提高了安全性。

13.

发明公开
一种语音识别方法及装置无效

公开(公告)号：CN103714812A

公开(公告)日：2014-04-09

申请号：CN201310717335.0

申请日：2013-12-23

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 苏丹

IPC: G10L15/07 , G10L15/26

Abstract: 本发明涉及信息处理技术领域，尤其涉及一种语音识别方法及装置；其中，所述方法包括：获取语音数据；根据所述语音数据的属性信息自动确定所述语音数据的类型；选择与所述语音数据的类型相匹配的声学模型进行语音识别。通过本发明技术方案，根据语音数据类型建立相应的声学模型，使得声学模型的建立更具准确性；进而根据相应的语音数据类型选择相应类型的声学模型进行语音识别，使得语音的识别更具准确性。

14.

发明公开
多语种语音识别的声学模型建立方法和装置有权

公开(公告)号：CN103400577A

公开(公告)日：2013-11-20

申请号：CN201310332146.1

申请日：2013-08-01

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 苏丹 , 尹钊

IPC: G10L15/06 , G10L15/18

Abstract: 本发明公开了一种多语种语音识别的声学模型建立方法和装置，所述方法包括：利用全部语音特征数据训练深度神经网络；利用不同语种的语音特征数据分别训练所述对应于不同语种的多个输出层；以及将所述对应于不同语种的多个输出层合并成为总输出层。本发明公开的多语种语音识别的声学模型建立方法使用深度神经网络建立多语种语音识别的声学模型，实现了对多语种语音的识别，提高了语音识别的准确性。

Patent Agency Ranking