语音识别中多发音问题的处理的方法、装置、设备及介质
摘要:
本申请涉及到语音识别技术领域,公开了语音识别中多发音问题的处理的方法、装置、设备及介质,其方法包括:构建文本语料,并将所述文本语料中包含的单词序列转为音素序列;基于所述音素序列,通过音素拼接构造伪单词;使用伪单词替换发音词典中的单词;将所有伪单词按照发音词典的格式整理成伪单词列表,并更新发音词典;使用更新后的所述发音词典对语音识别模型进行区分性训练。本申请解决了命令词识别过程中多发音问题导致的识别准确性下降的问题,通过伪单词的构造和替换,显著减少了网络模型占用的空间和解码所需的空间,使得该方法能够在资源极低的设备上进行部署。
0/0