-
公开(公告)号:CN102013253A
公开(公告)日:2011-04-13
申请号:CN200910172875.9
申请日:2009-09-07
Applicant: 株式会社东芝
Abstract: 本发明涉及一种基于语音单元语速的差异的语音识别方法,其包括:对所输入的语音进行预处理;提取所述语音的声学特征;基于预先训练的声学模型和所提取的所述语音的声学特征,对所述语音进行解码,以获得所述语音的多个识别结果候选,其中所述多个识别结果候选的每一个具有声学得分以及所包含的语音单元的段长;对于所述多个识别结果候选的每一个,基于所包含的语音单元的段长,计算该识别结果候选的语音单元语速差异值;基于所计算的语音单元语速差异值和声学得分,计算该识别结果候选的综合得分;以及从所述多个识别结果候选中选择所述综合得分最高的识别结果候选,作为所述语音的最终识别结果。此外,本发明还提供了相应的语音识别系统。
-
公开(公告)号:CN101465122A
公开(公告)日:2009-06-24
申请号:CN200710199194.2
申请日:2007-12-20
Applicant: 株式会社东芝
CPC classification number: G10L21/0208
Abstract: 本发明提供了一种语音的频谱波峰的检测方法和装置以及语音识别方法和系统。该检测语音的频谱波峰的方法包括:从上述语音的功率谱中检测出语音频谱波峰候选;以及根据波峰间距和/或相邻帧的波峰位置,去除上述语音频谱波峰候选中的噪声波峰,以检测出语音频谱波峰。在本发明中,通过在语音频谱波峰的检测中利用波峰间距以及相邻帧的限制去除噪声波峰,能够得到可靠的语音频谱波峰。进而,通过将所得到的语音频谱波峰的能量值代替整个功率谱用于提取语音的梅尔倒谱系数特征,能够在不增加语音特征维数的情况下提高语音识别的抗噪稳健性。
-
公开(公告)号:CN102013253B
公开(公告)日:2012-06-06
申请号:CN200910172875.9
申请日:2009-09-07
Applicant: 株式会社东芝
Abstract: 本发明涉及一种基于语音单元语速的差异的语音识别方法,其包括:对所输入的语音进行预处理;提取所述语音的声学特征;基于预先训练的声学模型和所提取的所述语音的声学特征,对所述语音进行解码,以获得所述语音的多个识别结果候选,其中所述多个识别结果候选的每一个具有声学得分以及所包含的语音单元的段长;对于所述多个识别结果候选的每一个,基于所包含的语音单元的段长,计算该识别结果候选的语音单元语速差异值;基于所计算的语音单元语速差异值和声学得分,计算该识别结果候选的综合得分;以及从所述多个识别结果候选中选择所述综合得分最高的识别结果候选,作为所述语音的最终识别结果。此外,本发明还提供了相应的语音识别系统。
-
公开(公告)号:CN101154383B
公开(公告)日:2010-10-06
申请号:CN200610141240.9
申请日:2006-09-29
Applicant: 株式会社东芝
Abstract: 本发明提供了噪声抑制方法,提取语音特征的方法,语音识别方法和训练语音模型的方法,以及噪声抑制装置,提取语音特征的装置,语音识别装置和训练语音模型的装置。根据本发明的一个方面,提供了一种用于含噪声语音谱的噪声抑制方法,包括:根据噪声估计谱,对所述含噪声语音谱进行对数谱最小均方误差估计,以降低所述含噪声语音谱的噪声;其中,通过以下步骤计算增益函数来进行所述对数谱最小均方误差估计:利用泰勒级数累加计算所述增益函数;利用数值积分计算所述增益函数;以及合并所述泰勒级数累加的结果和所述数值积分的结果。
-
公开(公告)号:CN101154383A
公开(公告)日:2008-04-02
申请号:CN200610141240.9
申请日:2006-09-29
Applicant: 株式会社东芝
Abstract: 本发明提供了噪声抑制方法,提取语音特征的方法,语音识别方法和训练语音模型的方法,以及噪声抑制装置,提取语音特征的装置,语音识别装置和训练语音模型的装置。根据本发明的一个方面,提供了一种用于含噪声语音谱的噪声抑制方法,包括:根据噪声估计谱,对所述含噪声语音谱进行对数谱最小均方误差估计,以降低所述含噪声语音谱的噪声;其中,通过以下步骤计算增益函数来进行所述对数谱最小均方误差估计:利用泰勒级数累加计算所述增益函数;利用数值积分计算所述增益函数;以及合并所述泰勒级数累加的结果和所述数值积分的结果。
-
-
-
-