-
公开(公告)号:CN105529028A
公开(公告)日:2016-04-27
申请号:CN201510903049.2
申请日:2015-12-09
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/187 , G10L25/51
CPC classification number: G10L15/187 , G10L25/51
Abstract: 本发明提出一种语音解析方法和装置,其中,方法包括:S1、接收输入的待检测语音信号;S2、分帧提取待检测语音信号的语音特征信息,根据语音特征信息和声学模型生成待检测语音信号的识别结果;S3、根据识别结果和预设静音检测算法初步检测出待检测语音信号的语音端点;S4、计算待检测语音信号的置信度信息;S5、解析待检测语音信号的语义信息;以及S6、根据置信度信息和语义信息获取待检测语音信号对应的语音解析结果。本发明实施例的语音解析方法和装置,能够准确地识别语音的有效性,以及通过语义解析,确定语义是否与上下文相关,提高了语音识别系统的性能,使得多轮对话交互过程更加流畅,提升用户使用体验。
-
公开(公告)号:CN104580477A
公开(公告)日:2015-04-29
申请号:CN201510018632.5
申请日:2015-01-14
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: H04L29/08
Abstract: 本发明提供了一种语音数据处理方法和装置。该方法包括:响应第一用户发起的录音解析请求,根据所述录音解析请求中的客户标识获取与所述客户标识对应的客户的录音文件,将所述录音文件转换为文本文件,从转换后的文本文件中提取涉及所述客户的一个或多个关键字作为所述客户的客户资料,所述关键字包括所述客户的单位名称和关注信息。实施上述方法和装置,改善了客户资料数据获取的处理效率,方便了客户资料的完善和管理。
-
公开(公告)号:CN105261357A
公开(公告)日:2016-01-20
申请号:CN201510587721.1
申请日:2015-09-15
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种基于统计模型的语音端点检测方法及装置,其中,该方法包括:接收输入的待检测语音信号;分帧提取待检测语音信号的第一语音特征信息,并对第一语音特征信息进行抗噪处理,以生成待检测语音信号的第二语音特征信息;根据第二语音特征信息和声学模型生成待检测语音信号的识别结果;根据识别结果和预设静音检测算法初步检测出待检测语音信号的语音端点;以及计算待检测语音信号的置信度信息,并根据置信度信息对语音端点进行调整。本发明实施例的基于统计模型的语音端点检测方法,准确定位了待检测语音信号的语音端点,提高了语音端点检测的准确率,进而可提高语音识别的准确性,提高语音识别的性能。
-
公开(公告)号:CN105575386B
公开(公告)日:2019-07-30
申请号:CN201510956467.8
申请日:2015-12-18
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明公开了一种语音识别方法和装置,其中,该方法包括:获取待识别语音数据,提取其语音特征;根据第一语言模型和第二语言模型同时对语音特征进行解码,得到第一语音识别结果和第二语音识别结果、以及在第一语言模型下的第一累计概率和在第二语言模型下的第二累计概率;根据第一累计概率和第二累计概率确定最终识别结果;根据最终识别结果的出处判断是否对待识别语音数据进行语音识别。本发明实施例的语音识别方法能够提供稳定可靠的语音识别环境,保证人机交互的顺畅性。
-
公开(公告)号:CN105529028B
公开(公告)日:2019-07-30
申请号:CN201510903049.2
申请日:2015-12-09
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/187 , G10L25/51
Abstract: 本发明提出一种语音解析方法和装置,其中,方法包括:S1、接收输入的待检测语音信号;S2、分帧提取待检测语音信号的语音特征信息,根据语音特征信息和声学模型生成待检测语音信号的识别结果;S3、根据识别结果和预设静音检测算法初步检测出待检测语音信号的语音端点;S4、计算待检测语音信号的置信度信息;S5、解析待检测语音信号的语义信息;以及S6、根据置信度信息和语义信息获取待检测语音信号对应的语音解析结果。本发明实施例的语音解析方法和装置,能够准确地识别语音的有效性,以及通过语义解析,确定语义是否与上下文相关,提高了语音识别系统的性能,使得多轮对话交互过程更加流畅,提升用户使用体验。
-
公开(公告)号:CN105161092B
公开(公告)日:2017-03-01
申请号:CN201510595577.6
申请日:2015-09-17
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/02 , G10L15/065
Abstract: 本发明公开了一种语音识别方法和装置。所述方法包括:对输入语音进行声学特征提取,并根据所述提取的声学特征分别计算多个不同类型的声学模型中各声学建模单元的似然值;将所述多个不同类型的声学模型中各声学建模单元的似然值进行融合处理;根据融合处理结果获取所述输入语音的识别结果。所述装置包括:似然值计算模块,用于对输入语音进行声学特征提取,并根据所述提取的声学特征分别计算多个不同类型的声学模型中各声学建模单元的似然值;融合处理模块,用于将所述多个不同类型的声学模型中各声学建模单元的似然值进行融合处理;识别模块,用于根据融合处理结果获取所述输入语音的识别结果,增强了语音识别的鲁棒性,提高了识别准确度。
-
公开(公告)号:CN105261357B
公开(公告)日:2016-11-23
申请号:CN201510587721.1
申请日:2015-09-15
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种基于统计模型的语音端点检测方法及装置,其中,该方法包括:接收输入的待检测语音信号;分帧提取待检测语音信号的第一语音特征信息,并对第一语音特征信息进行抗噪处理,以生成待检测语音信号的第二语音特征信息;根据第二语音特征信息和声学模型生成待检测语音信号的识别结果;根据识别结果和预设静音检测算法初步检测出待检测语音信号的语音端点;以及计算待检测语音信号的置信度信息,并根据置信度信息对语音端点进行调整。本发明实施例的基于统计模型的语音端点检测方法,准确定位了待检测语音信号的语音端点,提高了语音端点检测的准确率,进而可提高语音识别的准确性,提高语音识别的性能。
-
公开(公告)号:CN105575386A
公开(公告)日:2016-05-11
申请号:CN201510956467.8
申请日:2015-12-18
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G10L15/02 , G10L15/063 , G10L15/22 , G10L2015/0638
Abstract: 本发明公开了一种语音识别方法和装置,其中,该方法包括:获取待识别语音数据,提取其语音特征;根据第一语言模型和第二语言模型同时对语音特征进行解码,得到第一语音识别结果和第二语音识别结果、以及在第一语言模型下的第一累计概率和在第二语言模型下的第二累计概率;根据第一累计概率和第二累计概率确定最终识别结果;根据最终识别结果的出处判断是否对待识别语音数据进行语音识别。本发明实施例的语音识别方法能够提供稳定可靠的语音识别环境,保证人机交互的顺畅性。
-
公开(公告)号:CN105513586A
公开(公告)日:2016-04-20
申请号:CN201510958817.4
申请日:2015-12-18
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种语音识别结果的显示方法和装置,该语音识别结果的显示方法包括:接收待识别的语音信号;对所述语音信号进行语音识别,得到中间识别结果,所述中间识别结果包括:非确定词和确定词;在语音识别过程中,在屏幕上显示所述非确定词和所述确定词。该方法能够在语音识别时显示中间识别结果,且能够加快中间识别结果的显示。
-
公开(公告)号:CN105161092A
公开(公告)日:2015-12-16
申请号:CN201510595577.6
申请日:2015-09-17
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/02 , G10L15/065
Abstract: 本发明公开了一种语音识别方法和装置。所述方法包括:对输入语音进行声学特征提取,并根据所述提取的声学特征分别计算多个不同类型的声学模型中各声学建模单元的似然值;将所述多个不同类型的声学模型中各声学建模单元的似然值进行融合处理;根据融合处理结果获取所述输入语音的识别结果。所述装置包括:似然值计算模块,用于对输入语音进行声学特征提取,并根据所述提取的声学特征分别计算多个不同类型的声学模型中各声学建模单元的似然值;融合处理模块,用于将所述多个不同类型的声学模型中各声学建模单元的似然值进行融合处理;识别模块,用于根据融合处理结果获取所述输入语音的识别结果,增强了语音识别的鲁棒性,提高了识别准确度。
-
-
-
-
-
-
-
-
-