语音识别方法、装置、存储介质及电子设备
摘要:
一种语音识别方法、装置、存储介质及电子设备,通过获取当前时间点的语音帧和当前时间点的视频帧,然后提取视频帧中的视频特征信息,其中视频特征信息用于表征当前用户对应语音帧的语音动作,并且基于语音帧和视频特性信息确定语音帧的识别结果,即结合语音帧的信息和用户对应该语音帧的语音动作来识别该语音帧,不仅提高了语音帧的识别结果的准确性,而且针对每一帧语音进行识别,提高了语音交互的相应时效性,实时识别用户语音,提高了语音交互的体验效果。
公开/授权文献
0/0