自动加配字幕的方法和系统

    公开(公告)号:CN1870728A

    公开(公告)日:2006-11-29

    申请号:CN200510011770.7

    申请日:2005-05-23

    Applicant: 北京大学

    Abstract: 本发明基于统计模式识别的理论,设计并实现了字幕自动加配系统及其解决方案。针对非现场直播类型的影视节目和现场直播型电视节目。本发明的字幕加配分别采用如下的技术方案:针对非现场直播类型的影视节目,字幕自动加配系统包括三个模块:字幕自动识别模块,用于自动识别影视作品中与视频流相对应的字幕脚本;字幕辅助校对模块,进行字幕校对;以及,字幕大段对齐模块,用于将得到的音频和字幕脚本在时间尺度上按照一定的语言单元自动对齐,在播放影视节目时可以准确地同步显示相应字幕。针对现场直播型电视节目,字幕自动加配系统即为实时对齐模块,用于将事先准备好的节目文稿与实时输入的音频流在时间轴上对齐,并且实时地显示字幕。

    自动加配字幕的方法和系统

    公开(公告)号:CN100536532C

    公开(公告)日:2009-09-02

    申请号:CN200510011770.7

    申请日:2005-05-23

    Applicant: 北京大学

    Abstract: 本发明基于统计模式识别的理论,设计并实现了字幕自动加配系统及其解决方案。针对非现场直播类型的影视节目和现场直播型电视节目。本发明的字幕加配分别采用如下的技术方案:针对非现场直播类型的影视节目,字幕自动加配系统包括三个模块:字幕自动识别模块,用于自动识别影视作品中与视频流相对应的字幕脚本;字幕辅助校对模块,进行字幕校对;以及,字幕大段对齐模块,用于将得到的音频和字幕脚本在时间尺度上按照一定的语言单元自动对齐,在播放影视节目时可以准确地同步显示相应字幕。针对现场直播型电视节目,字幕自动加配系统即为实时对齐模块,用于将事先准备好的节目文稿与实时输入的音频流在时间轴上对齐,并且实时地显示字幕。

    结合语义和声纹信息的说话人身份确认系统

    公开(公告)号:CN1547191A

    公开(公告)日:2004-11-17

    申请号:CN200310118507.9

    申请日:2003-12-12

    Abstract: 本发明涉及一种语音识别系统,尤其是利用说话人声音的独特生物测定学特征来识别说话人身份的系统。我们的目的在于用语义信息确认来替代基于声纹确认的训练过程,在基于声纹确认的准备工作还没有完成之前来进行识别工作。同时语义信息确认还可以帮助声纹确认搜集所需的训练语料,等基于声纹识别的准备工作完成之后,我们可以把二者结合起来,进一步增强系统的安全性。本发明采取的技术方案是根据说话人的声纹特征通过GMM模型(高斯混合模型)建立声纹模型;通过电话等语音输入设备录入语音,对声音进行预处理;对处理后的声音根据一定的声纹模型进行声纹特征提取;同时进行文本判断;用声纹特征和文本判断来识别说话人身份。本发明包括如下几个子系统:特征提取、声学模型建模、基于语义的说话人确认VIV(语义信息确认)系统、文本有关和文本无关的声纹确认系统。各子系统在特征、统计模型的选择、目标模型和背景模型的建模以及统计确认都有其各自的特点达到本发明的目的。

    结合语义和声纹信息的说话人身份确认系统

    公开(公告)号:CN2763935Y

    公开(公告)日:2006-03-08

    申请号:CN200320126875.3

    申请日:2003-12-12

    Abstract: 一种结合语义和声纹信息的说话人身份确认系统,其特征在于:该装置包括外部设备和内部子系统部分,外部设备包括电话语音卡和服务端口,内部子系统部分包括特征提取部分、声学模型建模部分、基于语义的说话人确认VIV(语义信息确认)部分、文本有关和文本无关的声纹确认部分,各个子系统部分相互连接共同实现对说话人身份的确认我们的目的在于用语义信息确认来替代基于声纹确认的训练过程,在基于声纹确认的准备工作还没有完成之前来进行识别工作。同时语义信息确认还可以帮助声纹确认搜集所需的训练语料,等基于声纹识别的准备工作完成之后,我们可以把二者结合起来,进一步增强系统的安全性。

Patent Agency Ranking