发明授权
- 专利标题: 音视频字幕生成方法及装置
-
申请号: CN201510629172.X申请日: 2015-09-28
-
公开(公告)号: CN105244022B公开(公告)日: 2019-10-18
- 发明人: 周明 , 江源 , 王影 , 胡国平 , 胡郁 , 刘庆峰
- 申请人: 科大讯飞股份有限公司
- 申请人地址: 安徽省合肥市高新开发区望江西路666号
- 专利权人: 科大讯飞股份有限公司
- 当前专利权人: 科大讯飞股份有限公司
- 当前专利权人地址: 安徽省合肥市高新开发区望江西路666号
- 代理机构: 北京维澳专利代理有限公司
- 代理商 刘路尧; 逢京喜
- 主分类号: G10L15/00
- IPC分类号: G10L15/00 ; G10L15/26
摘要:
本发明公开了一种音视频字幕生成方法及装置,该方法包括:接收待生成字幕的语音数据及文本数据;根据发音人韵律对所述语音数据进行切分,得到符合说话人习惯的各语音数据段;根据所述语音数据段对所述文本数据进行切分,得到与所述语音数据段对应的文本数据段;根据各语音数据段的时间信息获取与所述语音数据段对应的文本数据段的开始时间和结束时间。本发明可以简单高效地实现文本数据的显示与语音数据的同步,使生成的字幕更完整。
公开/授权文献
- CN105244022A 音视频字幕生成方法及装置 公开/授权日:2016-01-13