-
公开(公告)号:CN114171009A
公开(公告)日:2022-03-11
申请号:CN202111534483.X
申请日:2021-12-15
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种用于目标设备的语音识别方法、装置、设备及存储介质,所述方法包括:获取音频信号,得到所述音频信号的声学特征,将所述声学特征输入第一声学模型,得到音素级特征与该音素级特征相关联的音素级概率向量;若所述目标设备的当前工作模式为唤醒模式,则将音素级概率向量输入预设的解码器以识别唤醒词,并在识别出唤醒词的情况下将目标设备的工作模式转换为命令词模式;若目标设备的当前工作模式为命令词模式,则将音素级特征输入第二声学模型,以在识别出命令词时触发所述目标设备执行所述命令词对应的动作。本发明可解决目前不同长度的命令词在通过解码网络时因为不等长比较而导致的串扰问题,有效地提升了命令词识别的正确性。
-
公开(公告)号:CN118038863A
公开(公告)日:2024-05-14
申请号:CN202311718263.1
申请日:2023-12-13
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种唤醒语音识别方法、装置、电子设备及存储介质,该方法包括:基于待识别语音的声学特征,从模型集合中确定出与所述声学特征适配的建模模型,并利用所述建模模型对所述声学特征进行特征建模处理,得到建模声学特征;所述模型集合包括用于对唤醒语音的声学特征进行建模的唤醒语音建模模型,以及用于对非唤醒语音的声学特征进行建模的非唤醒语音建模模型;基于所述建模声学特征,从所述待识别语音中识别唤醒语音。上述方案能够提高唤醒语音识别的准确度和识别效率。
-