检测语音关键词的方法和设备及检索方法和系统

    公开(公告)号:CN101593519B

    公开(公告)日:2012-09-19

    申请号:CN200810099976.3

    申请日:2008-05-29

    Abstract: 公开了一种检测语音关键词的方法和设备以及相应的检索方法和系统,该设备包括:VQ码本库,存储了基于预定声学模型的VQ码本;状态特征库,存储了该音频文件的VQ状态序列矩阵,该矩阵包括该音频文件的各个语音帧的VQ码本编号和相应的声学概率值;状态序列生成单元,基于VQ码本库中的VQ码本,将输入的关键词转换成相应的VQ状态序列;以及匹配单元,利用转换的VQ状态序列对状态特征库中的VQ状态序列矩阵进行缩减,并用该VQ状态序列在经缩减的矩阵中搜索该语音关键词。利用本发明的技术,能够从音频文件中快速检测到语音关键词,以及从音频文件库中快速找到含有该关键词的音频文件。

    定位语音中的关键词的方法和设备以及语音识别系统

    公开(公告)号:CN101154379A

    公开(公告)日:2008-04-02

    申请号:CN200610152758.2

    申请日:2006-09-27

    Abstract: 公开了一种定位语音中的关键词的方法和设备以及语音识别系统。所述方法包括步骤:提取构成待识别语音的各个帧的特征参数矢量,以形成用于描述待识别语音的特征参数矢量序列;利用包含多个码本矢量的码本对特征参数矢量序列进行规整化处理,以得到待识别语音在矢量空间中的特征轨迹;以及匹配预先存储的关键词模板轨迹和所述特征轨迹,以确定关键词的位置。利用本发明,由于基于同一码本来描述关键词模板轨迹和待识别语音的特征空间轨迹,所以在具有相同音韵特征结构的音频帧进行线性移动匹配时不需要重新刻度,这提高了定位和识别的速度,并同时保证了识别的精度。

    定位语音中的关键词的方法和设备以及语音识别系统

    公开(公告)号:CN101154379B

    公开(公告)日:2011-11-23

    申请号:CN200610152758.2

    申请日:2006-09-27

    Abstract: 公开了一种定位语音中的关键词的方法和设备以及语音识别系统。所述方法包括步骤:提取构成待识别语音的各个帧的特征参数矢量,以形成用于描述待识别语音的特征参数矢量序列;利用包含多个码本矢量的码本对特征参数矢量序列进行规整化处理,以得到待识别语音在矢量空间中的特征轨迹;以及匹配预先存储的关键词模板轨迹和所述特征轨迹,以确定关键词的位置。利用本发明,由于基于同一码本来描述关键词模板轨迹和待识别语音的特征空间轨迹,所以在具有相同音韵特征结构的音频帧进行线性移动匹配时不需要重新刻度,这提高了定位和识别的速度,并同时保证了识别的精度。

    检测语音关键词的方法和设备及检索方法和系统

    公开(公告)号:CN101593519A

    公开(公告)日:2009-12-02

    申请号:CN200810099976.3

    申请日:2008-05-29

    Abstract: 公开了一种检测语音关键词的方法和设备以及相应的检索方法和系统,该设备包括:VQ码本库,存储了基于预定声学模型的VQ码本;状态特征库,存储了该语音文件的VQ状态序列矩阵,该矩阵包括该语音文件的各个语音帧的VQ码本编号和相应的声学概率值;状态序列生成单元,基于VQ码本库中的VQ码本,将输入的关键词转换成相应的VQ状态序列;以及匹配单元,利用转换的VQ状态序列对状态特征库中的VQ状态序列矩阵进行缩减,并用该VQ状态序列在经缩减的矩阵中搜索该语音关键词。利用本发明的技术,能够从音频文件中快速检测到语音关键词,以及从音频文件库中快速找到含有该关键词的音频文件。

Patent Agency Ranking