语音识别方法、装置、存储介质及电子设备

发明授权

CN112017633B 语音识别方法、装置、存储介质及电子设备有权

请登陆查看更多内容

专利标题： 语音识别方法、装置、存储介质及电子设备
申请号： CN202010950236.7

申请日： 2020-09-10
公开(公告)号： CN112017633B

公开(公告)日： 2024-04-26
发明人: 宫一尘
申请人： 北京地平线信息技术有限公司
申请人地址： 北京市海淀区中关村大街1号3层317
专利权人： 北京地平线信息技术有限公司
当前专利权人： 北京地平线信息技术有限公司
当前专利权人地址： 北京市海淀区中关村大街1号3层317
代理机构： 北京布瑞知识产权代理有限公司
代理商 黄俊
主分类号： G10L15/00
IPC分类号： G10L15/00 ; G10L15/02 ; G10L15/08

摘要：

一种语音识别方法、装置、存储介质及电子设备，通过获取当前时间点的语音帧和当前时间点的视频帧，然后提取视频帧中的视频特征信息，其中视频特征信息用于表征当前用户对应语音帧的语音动作，并且基于语音帧和视频特性信息确定语音帧的识别结果，即结合语音帧的信息和用户对应该语音帧的语音动作来识别该语音帧，不仅提高了语音帧的识别结果的准确性，而且针对每一帧语音进行识别，提高了语音交互的相应时效性，实时识别用户语音，提高了语音交互的体验效果。

公开/授权文献

CN112017633A 语音识别方法、装置、存储介质及电子设备公开/授权日：2020-12-01

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）