- 专利标题: 一种语音识别方法、装置、电子设备和存储介质
-
申请号: CN202111352684.8申请日: 2021-11-16
-
公开(公告)号: CN113823262B公开(公告)日: 2022-02-11
- 发明人: 颜京豪
- 申请人: 腾讯科技(深圳)有限公司
- 申请人地址: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人地址: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 代理机构: 北京同达信恒知识产权代理有限公司
- 代理商 朱佳
- 主分类号: G10L15/00
- IPC分类号: G10L15/00 ; G10L15/02 ; G10L15/06 ; G10L15/16 ; G06N3/08
摘要:
本申请涉及语音识别技术领域,尤其涉及一种语音识别方法、装置、电子设备和存储介质,可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景,用以高效准确地实现多方言目标语言的语音识别。其中,方法包括:获取目标语言的待识别语音数据;提取待识别语音数据中各帧语音数据各自对应的语音声学特征;通过对语音声学特征进行深度特征提取,获取对应的方言嵌入特征;通过对语音声学特征进行编码,获得对应的声学编码特征;基于方言嵌入特征,声学编码特征,对待识别语音数据进行方言语音识别,获得待识别语音数据对应的目标文本信息与目标方言类别。本申请结合方言嵌入特征和声学编码特征综合学习,可以高效准确地实现识别多种方言的语音识别。
公开/授权文献
- CN113823262A 一种语音识别方法、装置、电子设备和存储介质 公开/授权日:2021-12-21