一种语音识别方法、装置、电子设备和存储介质
摘要:
本申请涉及语音识别技术领域,尤其涉及一种语音识别方法、装置、电子设备和存储介质,可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景,用以高效准确地实现多方言目标语言的语音识别。其中,方法包括:获取目标语言的待识别语音数据;提取待识别语音数据中各帧语音数据各自对应的语音声学特征;通过对语音声学特征进行深度特征提取,获取对应的方言嵌入特征;通过对语音声学特征进行编码,获得对应的声学编码特征;基于方言嵌入特征,声学编码特征,对待识别语音数据进行方言语音识别,获得待识别语音数据对应的目标文本信息与目标方言类别。本申请结合方言嵌入特征和声学编码特征综合学习,可以高效准确地实现识别多种方言的语音识别。
0/0