一种基于语音识别的音字同步方法

发明公开

请登陆查看更多内容

专利标题： 一种基于语音识别的音字同步方法
申请号： CN202110427067.3

申请日： 2021-04-20
公开(公告)号： CN113179444A

公开(公告)日： 2021-07-27
发明人: 张鑫晟 , 潘晨高 , 沈童 , 徐浩然 , 王英钒 , 高飞
申请人： 浙江工业大学
申请人地址： 浙江省杭州市拱墅区朝晖六区潮王路18号
专利权人： 浙江工业大学
当前专利权人： 浙江工业大学
当前专利权人地址： 浙江省杭州市拱墅区朝晖六区潮王路18号
代理机构： 杭州浙科专利事务所
代理商 周红芳
主分类号： H04N21/43
IPC分类号： H04N21/43 ; H04N21/488 ; H04N21/439 ; H04N21/4402 ; H04N5/278 ; H04N5/04 ; G10L15/26 ; G10L15/02 ; G10L25/24 ; G10L25/57 ; G10L21/0208

摘要：

本发明公开了一种基于语音识别的音字同步方法。该方法首先通过对音频进行端点检测得到音频中人说话的前后端点，然后对音频进行降噪提取特征值，再通过声音模型和语言模型进行语音识别，然后根据识别出的字的特征值判断该字的起止时间,当音频当前播放时间与起始时间相同时，利用Vue的双向绑定机制在屏幕中显示该字。本发明能够得到语音识别结果中每个字在音频中的起始时间与结束时间，并实现音字完全同步显示，可以在语音识别效果检测和视频制作领域起到巨大作用。

公开/授权文献

CN113179444B 一种基于语音识别的音字同步方法公开/授权日：2022-05-17

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

H	电学
H04	电通信技术
H04N	图像通信，如电视
H04N21/00	可选的内容分发，例如交互式电视,或视频点播[VOD]（运动视频数据的实时双向传输入H04N7/14）
H04N21/40	.专门适用于接收内容或者与内容交互的客户端设备，如STB〔机顶盒〕；相关操作
H04N21/43	..内容或者附加数据的处理，例如解复用来自数字视频流的附加数据；基本客户端操作，例如：本地网络的监控或者译码器时钟的同步；客户端中间件