-
公开(公告)号:CN1863039B
公开(公告)日:2012-03-21
申请号:CN200510069126.5
申请日:2005-05-11
Applicant: 北京大学
Abstract: 本发明提供一种以音频信号为载体,以模拟音频通道为信道的隐藏通信系统。本发明的系统是以在模拟音频通道中传输隐藏信息为目的,并具体解决了系统对载体噪声干扰的抵抗和信息传输的接收同步等技术关键。在发送子系统中,系统通过改进的扩展谱方法,即“双相调制”扩展谱技术,将隐藏信息嵌入到普通的音频信号中。该技术的采用能够有效地减小音频载体信号对隐藏信息解调的干扰。同时针对隐藏信息的编码方式,系统引用了RS信道编码方案,以增强对噪声干扰的鲁棒性。另外,利用上述改进的扩展谱技术,系统在载体的高频段中嵌入信号帧同步信息,并在接收方子系统中对其进行相关提取,并通过同步信号的相位调整信号帧同步点来实现信息的接收同步。
-
公开(公告)号:CN100536532C
公开(公告)日:2009-09-02
申请号:CN200510011770.7
申请日:2005-05-23
Applicant: 北京大学
IPC: H04N5/278
Abstract: 本发明基于统计模式识别的理论,设计并实现了字幕自动加配系统及其解决方案。针对非现场直播类型的影视节目和现场直播型电视节目。本发明的字幕加配分别采用如下的技术方案:针对非现场直播类型的影视节目,字幕自动加配系统包括三个模块:字幕自动识别模块,用于自动识别影视作品中与视频流相对应的字幕脚本;字幕辅助校对模块,进行字幕校对;以及,字幕大段对齐模块,用于将得到的音频和字幕脚本在时间尺度上按照一定的语言单元自动对齐,在播放影视节目时可以准确地同步显示相应字幕。针对现场直播型电视节目,字幕自动加配系统即为实时对齐模块,用于将事先准备好的节目文稿与实时输入的音频流在时间轴上对齐,并且实时地显示字幕。
-
公开(公告)号:CN1967659A
公开(公告)日:2007-05-23
申请号:CN200510086877.8
申请日:2005-11-14
Applicant: 北京大学科技开发部
Abstract: 本发明提供一种在噪声环境中抑止含噪语音中的噪声成分,提高语音质量和可懂度的语音增强方法。根据本发明的方法,具体包括以下步骤:1)首先利用端点检测技术对语音中的噪声谱进行估计;2)利用两步维纳滤波技术去除噪声;3)同时根据听觉掩蔽曲线对滤波参数进行调整。本发明中的去噪方法,在信号层次和听觉感知层次均进行了充分的研究与考虑。对于估计噪声,采用鲁棒性很好的端点检测方法,用之尽可能的准确估计出噪声谱。进一步采用了两步维纳滤波进一步解决这个问题。同时,考虑到人耳的特点,运用听觉掩蔽曲线,使得得到的信号失真减小。这样,最终增强后的信号,在语音质量与可懂度上都有比较大的提高。
-
公开(公告)号:CN1870134A
公开(公告)日:2006-11-29
申请号:CN200510011781.5
申请日:2005-05-24
Applicant: 北京大学科技开发部
Abstract: 本发明提出了一种语音时长拉伸方法,它应用在数字助听器中,解决了老年性聋患者由于感知能力缓慢,导致语音可懂度下降的问题。本发明采用语音时长拉伸方法,在不改变采样率和基音周期的情况下,通过复制、插入整周期的基音信号,扩展浊音信号的波形,以降低输入语音的速率,提高老年性聋患者的语音可懂度。具体技术包括:能量比较,基音周期检测,波形扩展等。本发明中采用的方法有效的解决了老年性聋患者感知能力缓慢,在语音速率较快时,语音可懂度明显下降的问题。其优点体现在拉长了语音信号的持续时间,降低了语音的速率,这些都是在不改变采样率和基音周期的情况下完成的,因而引入的失真较小。
-
公开(公告)号:CN1868427A
公开(公告)日:2006-11-29
申请号:CN200510011783.4
申请日:2005-05-24
Applicant: 北京大学科技开发部
IPC: A61F11/04
Abstract: 本发明中提出一种适合汉语语音编码策略的人工耳蜗方法,包括以下几个部分:预加重,语音信号经一阶FIR高通滤波器提升信号中的高频成分;分带滤波,根据人耳听觉特性对语音频带进行等bark尺度划分,分为若干子带,并基于傅氏变换的频域滤波技术对信号进行零相位失真滤波,得到每个子带的信号;准锁相刺激发放,包括过零点检测、包络提取、非线性动态范围压缩、电脉冲发放;过零点检测检测各个频带的信号正向过零点,作为该频带的零相位时刻;包络提取,提取各个子带信号的包络,如利用Hilbert变换来求;非线性动态范围压缩对包络值的动态范围进行非线性压缩;以及电脉冲发放。
-
公开(公告)号:CN1547191A
公开(公告)日:2004-11-17
申请号:CN200310118507.9
申请日:2003-12-12
IPC: G10L17/00
Abstract: 本发明涉及一种语音识别系统,尤其是利用说话人声音的独特生物测定学特征来识别说话人身份的系统。我们的目的在于用语义信息确认来替代基于声纹确认的训练过程,在基于声纹确认的准备工作还没有完成之前来进行识别工作。同时语义信息确认还可以帮助声纹确认搜集所需的训练语料,等基于声纹识别的准备工作完成之后,我们可以把二者结合起来,进一步增强系统的安全性。本发明采取的技术方案是根据说话人的声纹特征通过GMM模型(高斯混合模型)建立声纹模型;通过电话等语音输入设备录入语音,对声音进行预处理;对处理后的声音根据一定的声纹模型进行声纹特征提取;同时进行文本判断;用声纹特征和文本判断来识别说话人身份。本发明包括如下几个子系统:特征提取、声学模型建模、基于语义的说话人确认VIV(语义信息确认)系统、文本有关和文本无关的声纹确认系统。各子系统在特征、统计模型的选择、目标模型和背景模型的建模以及统计确认都有其各自的特点达到本发明的目的。
-
公开(公告)号:CN101510221B
公开(公告)日:2012-05-30
申请号:CN200910131826.0
申请日:2009-04-08
Applicant: 北京大学
Abstract: 本发明公开了一种基于自然语言理解的查询语句分析方法与系统,属于信息检索技术领域。本发明的方法为:1)对输入的中文查询语句进行自动分词、命名实体识别和词性标注;2)对分词后的句子进行句法结构分析,得到句法结构树;根据词性标注后的句子确定每个词的词义;3)根据句子的句法结构和每个词的词义,对句子中谓词进行语义角色标注;4)根据上述对句子在词法、句法和语义层上的分析结果扩充关键词,提取能反映用户信息检索需求的关键词。本发明的系统包括词法分析模块、句法分析模块、语义分析模块和关键词提取模块。本发明可以大大提高查询结果的准确率,使用户得到想要的查询结果。
-
公开(公告)号:CN100535992C
公开(公告)日:2009-09-02
申请号:CN200510086876.3
申请日:2005-11-14
Applicant: 北京大学科技开发部
IPC: G10L21/02
Abstract: 本发明提出一种小尺度麦克风阵列语音增强系统和方法,根据本发明的系统主要分为信号采集和信号处理两个子部分。信号采集部分由麦克风阵列和AD转换器组成。含噪语音信号由麦克风采集为模拟信号,通过AD转换器转化成数字信号,在DSP处理芯片中进行信号增强,然后再通过usb口传输到计算机上进行保存。信号处理部分由麦克风一致性校正模块,自适应噪声消除模块,信噪比估计模块和声源位置自适应模块等组成。本发明的系统和分可以去除采集过程中引入的环境噪声,使得采集到的声源信号信噪比提高,从而获得更好的声源信号,在大多情况之下声源信号为语音信号,经过去噪处理对语音的可懂度有所提高。
-
公开(公告)号:CN101510221A
公开(公告)日:2009-08-19
申请号:CN200910131826.0
申请日:2009-04-08
Applicant: 北京大学
Abstract: 本发明公开了一种基于自然语言理解的查询语句分析方法与系统,属于信息检索技术领域。本发明的方法为:1)对输入的中文查询语句进行自动分词、命名实体识别和词性标注;2)对分词后的句子进行句法结构分析,得到句法结构树;根据词性标注后的句子确定每个词的词义;3)根据句子的句法结构和每个词的词义,对句子中谓词进行语义角色标注;4)根据上述对句子在词法、句法和语义层上的分析结果扩充关键词,提取能反映用户信息检索需求的关键词。本发明的系统包括词法分析模块、句法分析模块、语义分析模块和关键词提取模块。本发明可以大大提高查询结果的准确率,使用户得到想要的查询结果。
-
公开(公告)号:CN100440317C
公开(公告)日:2008-12-03
申请号:CN200510011780.0
申请日:2005-05-24
Applicant: 北京大学科技开发部
Abstract: 本发明中提出一种数字助听器语音频率压缩方法,通过对信号的短时频谱系数进行处理,将宽带语音信号压缩为窄带语音信号。根据本发明的方法包括以下技术:1)利用加窗傅氏变换进行时频域的转换;2)通过信号对数谱的斜率来判断语音信号的能量分布,并动态地调整语音频谱;3)通过去除高频谱系数的方法,实现低通滤波;4)通过频谱包络调整的方法,压缩语音频带。本发明只通过调整信号频谱包络来压缩信号带宽,这种方法相当于对信号进行线性处理,避免了非线性频移方法给语音信号带来的听觉失真,而动态的频谱调整又能尽量地保证语音的低频段信息不受破坏,因此利用该方案能够产生高质量的清晰语音。
-
-
-
-
-
-
-
-
-