一种语音识别方法、装置、电子设备和存储介质

发明授权

CN113823262B 一种语音识别方法、装置、电子设备和存储介质有权

请登陆查看更多内容

专利标题： 一种语音识别方法、装置、电子设备和存储介质
申请号： CN202111352684.8

申请日： 2021-11-16
公开(公告)号： CN113823262B

公开(公告)日： 2022-02-11
发明人: 颜京豪
申请人： 腾讯科技(深圳)有限公司
申请人地址： 广东省深圳市南山区高新区科技中一路腾讯大厦35层
专利权人： 腾讯科技(深圳)有限公司
当前专利权人： 腾讯科技(深圳)有限公司
当前专利权人地址： 广东省深圳市南山区高新区科技中一路腾讯大厦35层
代理机构： 北京同达信恒知识产权代理有限公司
代理商 朱佳
主分类号： G10L15/00
IPC分类号： G10L15/00 ; G10L15/02 ; G10L15/06 ; G10L15/16 ; G06N3/08

摘要：

本申请涉及语音识别技术领域，尤其涉及一种语音识别方法、装置、电子设备和存储介质，可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景，用以高效准确地实现多方言目标语言的语音识别。其中，方法包括：获取目标语言的待识别语音数据；提取待识别语音数据中各帧语音数据各自对应的语音声学特征；通过对语音声学特征进行深度特征提取，获取对应的方言嵌入特征；通过对语音声学特征进行编码，获得对应的声学编码特征；基于方言嵌入特征，声学编码特征，对待识别语音数据进行方言语音识别，获得待识别语音数据对应的目标文本信息与目标方言类别。本申请结合方言嵌入特征和声学编码特征综合学习，可以高效准确地实现识别多种方言的语音识别。

公开/授权文献

CN113823262A 一种语音识别方法、装置、电子设备和存储介质公开/授权日：2021-12-21

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）