-
公开(公告)号:CN1870728A
公开(公告)日:2006-11-29
申请号:CN200510011770.7
申请日:2005-05-23
Applicant: 北京大学
IPC: H04N5/278
Abstract: 本发明基于统计模式识别的理论,设计并实现了字幕自动加配系统及其解决方案。针对非现场直播类型的影视节目和现场直播型电视节目。本发明的字幕加配分别采用如下的技术方案:针对非现场直播类型的影视节目,字幕自动加配系统包括三个模块:字幕自动识别模块,用于自动识别影视作品中与视频流相对应的字幕脚本;字幕辅助校对模块,进行字幕校对;以及,字幕大段对齐模块,用于将得到的音频和字幕脚本在时间尺度上按照一定的语言单元自动对齐,在播放影视节目时可以准确地同步显示相应字幕。针对现场直播型电视节目,字幕自动加配系统即为实时对齐模块,用于将事先准备好的节目文稿与实时输入的音频流在时间轴上对齐,并且实时地显示字幕。
-
公开(公告)号:CN1870135A
公开(公告)日:2006-11-29
申请号:CN200510011782.X
申请日:2005-05-24
Applicant: 北京大学科技开发部
Abstract: 助听器是帮助聋人听力康复的主要设备,频响补偿是助听器中不可缺少的信号处理技术。以往的听力补偿技术只考虑聋人自身听阈升高,动态范围变窄的问题;没有考虑由于人耳的听觉掩蔽效应引起的听阈上升现象。本发明根据人耳听觉掩蔽阈值,提出一种新的频响补偿方法,将它应用在数字助听器中,解决现有方法由于忽视听觉掩蔽效应,过分放大不可感知的信号成分,导致语音清晰度和可懂度下降的问题。根据本发明的数字助听器频响补偿方法包括一下技术:时频域转换,临界带的划分,掩蔽阈值的计算,频响补偿等。
-
公开(公告)号:CN1863039A
公开(公告)日:2006-11-15
申请号:CN200510069126.5
申请日:2005-05-11
Applicant: 北京大学
Abstract: 本发明提供一种以音频信号为载体,以模拟音频通道为信道的隐藏通信系统。本发明的系统是以在模拟音频通道中传输隐藏信息为目的,并具体解决了系统对载体噪声干扰的抵抗和信息传输的接收同步等技术关键。在发送子系统中,系统通过改进的扩展谱方法,即“双相调制”扩展谱技术,将隐藏信息嵌入到普通的音频信号中。该技术的采用能够有效地减小音频载体信号对隐藏信息解调的干扰。同时针对隐藏信息的编码方式,系统引用了RS信道编码方案,以增强对噪声干扰的鲁棒性。另外,利用上述改进的扩展谱技术,系统在载体的高频段中嵌入信号帧同步信息,并在接收方子系统中对其进行相关提取,并通过同步信号的相位调整信号帧同步点来实现信息的接收同步。
-
公开(公告)号:CN2763935Y
公开(公告)日:2006-03-08
申请号:CN200320126875.3
申请日:2003-12-12
IPC: G10L17/00
Abstract: 一种结合语义和声纹信息的说话人身份确认系统,其特征在于:该装置包括外部设备和内部子系统部分,外部设备包括电话语音卡和服务端口,内部子系统部分包括特征提取部分、声学模型建模部分、基于语义的说话人确认VIV(语义信息确认)部分、文本有关和文本无关的声纹确认部分,各个子系统部分相互连接共同实现对说话人身份的确认我们的目的在于用语义信息确认来替代基于声纹确认的训练过程,在基于声纹确认的准备工作还没有完成之前来进行识别工作。同时语义信息确认还可以帮助声纹确认搜集所需的训练语料,等基于声纹识别的准备工作完成之后,我们可以把二者结合起来,进一步增强系统的安全性。
-
-
-