-
公开(公告)号:CN107240396B
公开(公告)日:2023-01-17
申请号:CN201710457375.4
申请日:2017-06-16
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例公开了一种说话人自适应方法、装置、设备及存储介质。所述说话人自适应方法包括:获取目标说话人的第一语音数据;将所述第一语音数据输入预先训练得到的批规范化BN网络中进行自适应训练,得到包含所述目标说话人语音参数的语音识别模型。本发明实施例通过将目标说话人的第一语音数据输入预先训练得到的批规范化BN网络中进行自适应训练,得到包含所述目标说话人语音参数的语音识别模型,可以简化说话人自适应过程,降低自适应复杂度,提高自适应性能。
-
-
公开(公告)号:CN107704549A
公开(公告)日:2018-02-16
申请号:CN201710884466.6
申请日:2017-09-26
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06F17/30681 , G06F17/30675 , G10L15/22 , G10L17/005 , G10L17/04 , G10L25/54
Abstract: 本发明提出一种语音搜索方法、装置及计算机设备,其中方法包括:获取待搜索的语音信息;对语音信息进行特征提取,获取语音信息中的特征信息;采用各个类型模型对特征信息进行识别,确定语音信息的类型;类型包括:男声、女声和童声;类型模型包括:男声类型模型、女声类型模型以及童声类型模型;根据语音信息的类型采用对应的识别模型对特征信息进行识别,获取语音信息对应的文本信息;根据语音信息对应的文本信息进行搜索,获取与语音信息对应的搜索结果,从而能够采用各个类型模型对语音信息中的特征信息进行类型识别,以及采用类型的识别模型对特征信息进行识别,能够对男声、女声以及童声针对性的进行识别,提高语音识别的准确率。
-
公开(公告)号:CN107180628A
公开(公告)日:2017-09-19
申请号:CN201710361210.7
申请日:2017-05-19
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G10L15/02 , G10L15/063 , G10L15/16
Abstract: 本发明提供了一种建立声学特征提取模型的方法、提取声学特征的方法、装置。其中建立声学特征提取模型的方法包括:将从各用户标识对应的语音数据中分别提取的第一声学特征,作为训练数据;利用所述训练数据训练深度神经网络,得到声学特征提取模型;其中所述深度神经网络的训练目标为:最大化相同用户的第二声学特征之间的相似度且最小化不同用户的第二声学特征之间的相似度。本发明的声学特征提取模型能够自学习到达到训练目标的最优声学特征。相比较现有预设特征类型和变换方式的声学特征提取方式,实现更加灵活,准确性更高。
-
公开(公告)号:CN105957516A
公开(公告)日:2016-09-21
申请号:CN201610429948.8
申请日:2016-06-16
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/00
CPC classification number: G10L15/00 , G10L15/005
Abstract: 本发明实施例公开了一种多语音识别模型切换方法及装置,所述方法包括:获取用户输入语音中的至少一条语音信息;对所述语音信息进行识别和语言类别的匹配,以根据匹配度确定对应的目标语言类别;将当前使用的语音识别模型切换至与目标语言类别对应的语音识别模型。本发明实施例通过对获取的语音信息进行识别和语言类别的匹配,以根据匹配度确定对应的目标语言类别;将当前使用的语音识别模型切换至与目标语言类别对应的语音识别模型,能够实现不同语言间的语音识别模型的自动切换,不仅提高语音识别模型切换效率,而且使语音识别更加智能化。
-
公开(公告)号:CN106251859A
公开(公告)日:2016-12-21
申请号:CN201610585160.6
申请日:2016-07-22
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/06
Abstract: 本发明公开了一种语音识别处理方法和装置,其中,方法包括:根据全国所有地区的语音样本数据在预设的处理模型上进行训练,生成通用普通话声学模型;根据各省份的语音样本数据,分别在通用普通话声学模型上进行自适应训练,生成与各省份对应的带有方言口音的普通话声学模型。由此,基于不同地区的用户的口音差异,建立带有方言口音的普通话声学模型,提高了语音识别的性能。
-
-
公开(公告)号:CN106251859B
公开(公告)日:2019-05-31
申请号:CN201610585160.6
申请日:2016-07-22
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/06
Abstract: 本发明公开了一种语音识别处理方法和装置,其中,方法包括:根据全国所有地区的语音样本数据在预设的处理模型上进行训练,生成通用普通话声学模型;根据各省份的语音样本数据,分别在通用普通话声学模型上进行自适应训练,生成与各省份对应的带有方言口音的普通话声学模型。由此,基于不同地区的用户的口音差异,建立带有方言口音的普通话声学模型,提高了语音识别的性能。
-
公开(公告)号:CN105957516B
公开(公告)日:2019-03-08
申请号:CN201610429948.8
申请日:2016-06-16
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/06
Abstract: 本发明实施例公开了一种多语音识别模型切换方法及装置,所述方法包括:获取用户输入语音中的至少一条语音信息;对所述语音信息进行识别和语言类别的匹配,以根据匹配度确定对应的目标语言类别;将当前使用的语音识别模型切换至与目标语言类别对应的语音识别模型。本发明实施例通过对获取的语音信息进行识别和语言类别的匹配,以根据匹配度确定对应的目标语言类别;将当前使用的语音识别模型切换至与目标语言类别对应的语音识别模型,能够实现不同语言间的语音识别模型的自动切换,不仅提高语音识别模型切换效率,而且使语音识别更加智能化。
-
公开(公告)号:CN107610706A
公开(公告)日:2018-01-19
申请号:CN201710822725.2
申请日:2017-09-13
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了语音搜索结果的处理方法和处理装置。该方法的一具体实施方式包括:接收用户输入的语音信息,并提取语音信息的声学特征;基于声学特征,提取语音信息的辨识矢量i-vector特征;将i-vector特征在预先训练的判别模型中进行识别,其中,判别模型用于识别语音信息所对应的用户的身份信息;基于判别模型的识别结果,对获取到的与语音信息相关的搜索结果进行处理。该实施方式可以使搜索结果更加符合用户的需求,从而改善用户的搜索体验。
-
-
-
-
-
-
-
-
-