-
公开(公告)号:CN100535993C
公开(公告)日:2009-09-02
申请号:CN200510086877.8
申请日:2005-11-14
Applicant: 北京大学科技开发部
Abstract: 本发明提供一种在噪声环境中抑止含噪语音中的噪声成分,提高语音质量和可懂度的语音增强方法。根据本发明的方法,具体包括以下步骤:1)首先利用端点检测技术对语音中的噪声谱进行估计;2)利用两步维纳滤波技术去除噪声;3)同时根据听觉掩蔽曲线对滤波参数进行调整。本发明中的去噪方法,在信号层次和听觉感知层次均进行了充分的研究与考虑。对于估计噪声,采用鲁棒性很好的端点检测方法,用之尽可能的准确估计出噪声谱。进一步采用了两步维纳滤波进一步解决这个问题。同时,考虑到人耳的特点,运用听觉掩蔽曲线,使得得到的信号失真减小。这样,最终增强后的信号,在语音质量与可懂度上都有比较大的提高。
-
公开(公告)号:CN1967658A
公开(公告)日:2007-05-23
申请号:CN200510086876.3
申请日:2005-11-14
Applicant: 北京大学科技开发部
IPC: G10L21/02
Abstract: 本发明提出一种小尺度麦克风阵列语音增强系统和方法,根据本发明的系统主要分为信号采集和信号处理两个子部分。信号采集部分由麦克风阵列和AD转换器组成。含噪语音信号由麦克风采集为模拟信号,通过AD转换器转化成数字信号,在DSP处理芯片中进行信号增强,然后再通过usb口传输到计算机上进行保存。信号处理部分由麦克风一致性校正模块,自适应噪声消除模块,信噪比估计模块和声源位置自适应模块等组成。本发明的系统和分可以去除采集过程中引入的环境噪声,使得采集到的声源信号信噪比提高,从而获得更好的声源信号,在大多情况之下声源信号为语音信号,经过去噪处理对语音的可懂度有所提高。
-
公开(公告)号:CN100502819C
公开(公告)日:2009-06-24
申请号:CN200510011783.4
申请日:2005-05-24
Applicant: 北京大学科技开发部
IPC: A61F11/04
Abstract: 本发明中提出一种制造适合汉语语音编码策略的人工耳蜗的方法,包括以下几个部分:预加重,语音信号经一阶FIR高通滤波器提升信号中的高频成分;分带滤波,根据人耳听觉特性对语音频带进行等bark尺度划分,分为若干子带,并基于傅氏变换的频域滤波技术对信号进行零相位失真滤波,得到每个子带的信号;准锁相刺激发放,包括过零点检测、包络提取、非线性动态范围压缩、电脉冲发放;过零点检测检测各个频带的信号正向过零点,作为该频带的零相位时刻;包络提取,提取各个子带信号的包络,如利用Hilbert变换来求;非线性动态范围压缩对包络值的动态范围进行非线性压缩;以及电脉冲发放。
-
公开(公告)号:CN1870133A
公开(公告)日:2006-11-29
申请号:CN200510011780.0
申请日:2005-05-24
Applicant: 北京大学科技开发部
Abstract: 本发明中提出一种数字助听器语音频率压缩方法,通过对信号的短时频谱系数进行处理,将宽带语音信号压缩为窄带语音信号。根据本发明的方法包括以下技术:1)利用加窗傅氏变换进行时频域的转换;2)通过信号对数谱的斜率来判断语音信号的能量分布,并动态地调整语音频谱;3)通过去除高频谱系数的方法,实现低通滤波;4)通过频谱包络调整的方法,压缩语音频带。本发明只通过调整信号频谱包络来压缩信号带宽,这种方法相当于对信号进行线性处理,避免了非线性频移方法给语音信号带来的听觉失真,而动态的频谱调整又能尽量地保证语音的低频段信息不受破坏,因此利用该方案能够产生高质量的清晰语音。
-
公开(公告)号:CN1967659A
公开(公告)日:2007-05-23
申请号:CN200510086877.8
申请日:2005-11-14
Applicant: 北京大学科技开发部
Abstract: 本发明提供一种在噪声环境中抑止含噪语音中的噪声成分,提高语音质量和可懂度的语音增强方法。根据本发明的方法,具体包括以下步骤:1)首先利用端点检测技术对语音中的噪声谱进行估计;2)利用两步维纳滤波技术去除噪声;3)同时根据听觉掩蔽曲线对滤波参数进行调整。本发明中的去噪方法,在信号层次和听觉感知层次均进行了充分的研究与考虑。对于估计噪声,采用鲁棒性很好的端点检测方法,用之尽可能的准确估计出噪声谱。进一步采用了两步维纳滤波进一步解决这个问题。同时,考虑到人耳的特点,运用听觉掩蔽曲线,使得得到的信号失真减小。这样,最终增强后的信号,在语音质量与可懂度上都有比较大的提高。
-
公开(公告)号:CN1870134A
公开(公告)日:2006-11-29
申请号:CN200510011781.5
申请日:2005-05-24
Applicant: 北京大学科技开发部
Abstract: 本发明提出了一种语音时长拉伸方法,它应用在数字助听器中,解决了老年性聋患者由于感知能力缓慢,导致语音可懂度下降的问题。本发明采用语音时长拉伸方法,在不改变采样率和基音周期的情况下,通过复制、插入整周期的基音信号,扩展浊音信号的波形,以降低输入语音的速率,提高老年性聋患者的语音可懂度。具体技术包括:能量比较,基音周期检测,波形扩展等。本发明中采用的方法有效的解决了老年性聋患者感知能力缓慢,在语音速率较快时,语音可懂度明显下降的问题。其优点体现在拉长了语音信号的持续时间,降低了语音的速率,这些都是在不改变采样率和基音周期的情况下完成的,因而引入的失真较小。
-
公开(公告)号:CN1868427A
公开(公告)日:2006-11-29
申请号:CN200510011783.4
申请日:2005-05-24
Applicant: 北京大学科技开发部
IPC: A61F11/04
Abstract: 本发明中提出一种适合汉语语音编码策略的人工耳蜗方法,包括以下几个部分:预加重,语音信号经一阶FIR高通滤波器提升信号中的高频成分;分带滤波,根据人耳听觉特性对语音频带进行等bark尺度划分,分为若干子带,并基于傅氏变换的频域滤波技术对信号进行零相位失真滤波,得到每个子带的信号;准锁相刺激发放,包括过零点检测、包络提取、非线性动态范围压缩、电脉冲发放;过零点检测检测各个频带的信号正向过零点,作为该频带的零相位时刻;包络提取,提取各个子带信号的包络,如利用Hilbert变换来求;非线性动态范围压缩对包络值的动态范围进行非线性压缩;以及电脉冲发放。
-
公开(公告)号:CN100535992C
公开(公告)日:2009-09-02
申请号:CN200510086876.3
申请日:2005-11-14
Applicant: 北京大学科技开发部
IPC: G10L21/02
Abstract: 本发明提出一种小尺度麦克风阵列语音增强系统和方法,根据本发明的系统主要分为信号采集和信号处理两个子部分。信号采集部分由麦克风阵列和AD转换器组成。含噪语音信号由麦克风采集为模拟信号,通过AD转换器转化成数字信号,在DSP处理芯片中进行信号增强,然后再通过usb口传输到计算机上进行保存。信号处理部分由麦克风一致性校正模块,自适应噪声消除模块,信噪比估计模块和声源位置自适应模块等组成。本发明的系统和分可以去除采集过程中引入的环境噪声,使得采集到的声源信号信噪比提高,从而获得更好的声源信号,在大多情况之下声源信号为语音信号,经过去噪处理对语音的可懂度有所提高。
-
公开(公告)号:CN100440317C
公开(公告)日:2008-12-03
申请号:CN200510011780.0
申请日:2005-05-24
Applicant: 北京大学科技开发部
Abstract: 本发明中提出一种数字助听器语音频率压缩方法,通过对信号的短时频谱系数进行处理,将宽带语音信号压缩为窄带语音信号。根据本发明的方法包括以下技术:1)利用加窗傅氏变换进行时频域的转换;2)通过信号对数谱的斜率来判断语音信号的能量分布,并动态地调整语音频谱;3)通过去除高频谱系数的方法,实现低通滤波;4)通过频谱包络调整的方法,压缩语音频带。本发明只通过调整信号频谱包络来压缩信号带宽,这种方法相当于对信号进行线性处理,避免了非线性频移方法给语音信号带来的听觉失真,而动态的频谱调整又能尽量地保证语音的低频段信息不受破坏,因此利用该方案能够产生高质量的清晰语音。
-
公开(公告)号:CN1870135A
公开(公告)日:2006-11-29
申请号:CN200510011782.X
申请日:2005-05-24
Applicant: 北京大学科技开发部
Abstract: 助听器是帮助聋人听力康复的主要设备,频响补偿是助听器中不可缺少的信号处理技术。以往的听力补偿技术只考虑聋人自身听阈升高,动态范围变窄的问题;没有考虑由于人耳的听觉掩蔽效应引起的听阈上升现象。本发明根据人耳听觉掩蔽阈值,提出一种新的频响补偿方法,将它应用在数字助听器中,解决现有方法由于忽视听觉掩蔽效应,过分放大不可感知的信号成分,导致语音清晰度和可懂度下降的问题。根据本发明的数字助听器频响补偿方法包括一下技术:时频域转换,临界带的划分,掩蔽阈值的计算,频响补偿等。
-
-
-
-
-
-
-
-
-