-
公开(公告)号:CN109036384B
公开(公告)日:2019-11-15
申请号:CN201811036633.2
申请日:2018-09-06
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了语音识别方法和装置。该方法的一具体实施方式包括:从待处理语音信号中提取出声学特征,并基于待处理语音信号的声学特征进行语音识别,得到待处理语音信号对应的识别文本;将待处理语音信号的声学特征和待处理语音信号对应的识别文本输入已训练的音节对齐模型,得到待处理语音信号的声学特征对应的音节序列;基于待处理语音信号的声学特征对应的音节序列对待处理语音信号的声学特征进行定长处理,得到待处理语音信号的定长声学特征;采用已训练的声学置信度模型对待处理语音信号的定长声学特征进行声学置信度预测,得到待处理语音信号的声学置信度。该实施方式提升了声学置信度判决精度。
-
公开(公告)号:CN110718223A
公开(公告)日:2020-01-21
申请号:CN201911033410.5
申请日:2019-10-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了语音交互控制的方法、装置、设备和介质,涉及语音技术。一种语音交互控制的方法包括获得语音交互设备处的声音信号和从声音信号识别的识别信息;至少基于声音信号的声学特征表示和/或与识别信息相关联的语义特征表示确定声音信号的交互置信度;确定识别信息与声音信号的匹配状况;提供交互置信度和匹配状况以用于控制语音交互设备对声音信号的响应。由此,可以准确判断区别人机交互的声音和非人机交互的声音,提高语音交互控制的准确度和智能度,提升人机交互的用户体验。
-
公开(公告)号:CN110827799B
公开(公告)日:2022-06-10
申请号:CN201911146748.1
申请日:2019-11-21
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 根据本公开的实施例,提供了用于处理语音信号的方法、装置、设备和计算机可读存储介质。该方法包括获取所接收的语音信号的语音特征表示集合。该方法还包括基于从语音信号识别的文本,生成源文本特征表示集合,每个源文本特征表示与文本中的一个元素相对应。该方法还包括基于语音特征表示集合和源文本特征表示集合,生成目标文本特征表示集合。该方法还包括确定目标文本特征表示集合与针对文本预定义的参考文本特征表示集合的匹配程度,匹配程度指示对文本的识别的正确性。通过该方法,可以使得语音判定结果更准确,同时使得人机之间的交互更加顺畅,提升了人机交互的体验。
-
公开(公告)号:CN110718223B
公开(公告)日:2021-02-12
申请号:CN201911033410.5
申请日:2019-10-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了语音交互控制的方法、装置、设备和介质,涉及语音技术。一种语音交互控制的方法包括获得语音交互设备处的声音信号和从声音信号识别的识别信息;至少基于声音信号的声学特征表示和/或与识别信息相关联的语义特征表示确定声音信号的交互置信度;确定识别信息与声音信号的匹配状况;提供交互置信度和匹配状况以用于控制语音交互设备对声音信号的响应。由此,可以准确判断区别人机交互的声音和非人机交互的声音,提高语音交互控制的准确度和智能度,提升人机交互的用户体验。
-
公开(公告)号:CN110827799A
公开(公告)日:2020-02-21
申请号:CN201911146748.1
申请日:2019-11-21
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 根据本公开的实施例,提供了用于处理语音信号的方法、装置、设备和计算机可读存储介质。该方法包括获取所接收的语音信号的语音特征表示集合。该方法还包括基于从语音信号识别的文本,生成源文本特征表示集合,每个源文本特征表示与文本中的一个元素相对应。该方法还包括基于语音特征表示集合和源文本特征表示集合,生成目标文本特征表示集合。该方法还包括确定目标文本特征表示集合与针对文本预定义的参考文本特征表示集合的匹配程度,匹配程度指示对文本的识别的正确性。通过该方法,可以使得语音判定结果更准确,同时使得人机之间的交互更加顺畅,提升了人机交互的体验。
-
公开(公告)号:CN109036384A
公开(公告)日:2018-12-18
申请号:CN201811036633.2
申请日:2018-09-06
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了语音识别方法和装置。该方法的一具体实施方式包括:从待处理语音信号中提取出声学特征,并基于待处理语音信号的声学特征进行语音识别,得到待处理语音信号对应的识别文本;将待处理语音信号的声学特征和待处理语音信号对应的识别文本输入已训练的音节对齐模型,得到待处理语音信号的声学特征对应的音节序列;基于待处理语音信号的声学特征对应的音节序列对待处理语音信号的声学特征进行定长处理,得到待处理语音信号的定长声学特征;采用已训练的声学置信度模型对待处理语音信号的定长声学特征进行声学置信度预测,得到待处理语音信号的声学置信度。该实施方式提升了声学置信度判决精度。
-
-
-
-
-