发明授权
- 专利标题: 语音识别方法、装置、存储介质及电子设备
-
申请号: CN202010950236.7申请日: 2020-09-10
-
公开(公告)号: CN112017633B公开(公告)日: 2024-04-26
- 发明人: 宫一尘
- 申请人: 北京地平线信息技术有限公司
- 申请人地址: 北京市海淀区中关村大街1号3层317
- 专利权人: 北京地平线信息技术有限公司
- 当前专利权人: 北京地平线信息技术有限公司
- 当前专利权人地址: 北京市海淀区中关村大街1号3层317
- 代理机构: 北京布瑞知识产权代理有限公司
- 代理商 黄俊
- 主分类号: G10L15/00
- IPC分类号: G10L15/00 ; G10L15/02 ; G10L15/08
摘要:
一种语音识别方法、装置、存储介质及电子设备,通过获取当前时间点的语音帧和当前时间点的视频帧,然后提取视频帧中的视频特征信息,其中视频特征信息用于表征当前用户对应语音帧的语音动作,并且基于语音帧和视频特性信息确定语音帧的识别结果,即结合语音帧的信息和用户对应该语音帧的语音动作来识别该语音帧,不仅提高了语音帧的识别结果的准确性,而且针对每一帧语音进行识别,提高了语音交互的相应时效性,实时识别用户语音,提高了语音交互的体验效果。
公开/授权文献
- CN112017633A 语音识别方法、装置、存储介质及电子设备 公开/授权日:2020-12-01