-
公开(公告)号:CN103366737B
公开(公告)日:2016-08-10
申请号:CN201210090660.4
申请日:2012-03-30
Applicant: 株式会社东芝
IPC: G10L15/02
Abstract: 本发明提出了一种在自动语音识别中应用声调特征的装置和方法,该装置包括:分布估计模块,被配置为估计语音信号中的有声帧的声调特征的全局分布以及用于无声帧的随机值的全局分布;规整化模块,被配置为根据有声帧的声调特征的全局分布对用于无声帧的随机值的全局分布进行规整化;以及随机值调整模块,被配置为根据规整化的全局分布调整用于无声帧的随机值,以便将调整后的随机值赋值给语音信号中的无声帧,作为无声帧的声调特征。在本发明的一实施例中,该装置还包括特征合并模块,被配置为合并有声帧和无声帧的非声调声学特征、所述声调特征以及语音层级参数,以用于自动语音识别。
-
公开(公告)号:CN103366737A
公开(公告)日:2013-10-23
申请号:CN201210090660.4
申请日:2012-03-30
Applicant: 株式会社东芝
IPC: G10L15/02
Abstract: 本发明提出了一种在自动语音识别中应用声调特征的装置和方法,该装置包括:分布估计模块,被配置为估计语音信号中的有声帧的声调特征的全局分布以及用于无声帧的随机值的全局分布;规整化模块,被配置为根据有声帧的声调特征的全局分布对用于无声帧的随机值的全局分布进行规整化;以及随机值调整模块,被配置为根据规整化的全局分布调整用于无声帧的随机值,以便将调整后的随机值赋值给语音信号中的无声帧,作为无声帧的声调特征。在本发明的一实施例中,该装置还包括特征合并模块,被配置为合并有声帧和无声帧的非声调声学特征、所述声调特征以及语音层级参数,以用于自动语音识别。
-