一种基于语音识别的音字同步方法
摘要:
本发明公开了一种基于语音识别的音字同步方法。该方法首先通过对音频进行端点检测得到音频中人说话的前后端点,然后对音频进行降噪提取特征值,再通过声音模型和语言模型进行语音识别,然后根据识别出的字的特征值判断该字的起止时间,当音频当前播放时间与起始时间相同时,利用Vue的双向绑定机制在屏幕中显示该字。本发明能够得到语音识别结果中每个字在音频中的起始时间与结束时间,并实现音字完全同步显示,可以在语音识别效果检测和视频制作领域起到巨大作用。
公开/授权文献
0/0