-
公开(公告)号:CN108122559B
公开(公告)日:2021-05-14
申请号:CN201711397816.2
申请日:2017-12-21
Applicant: 北京工业大学
Abstract: 本发明公开一种数字助听器中基于深度学习的双耳声源定位方法,首先将双耳声源信号通过gammatone滤波器分解成若干信道,通过加权系数提取高能量的信道,接着利用头相关函数(head‑related‑transform function,HRTF)提取第一类特征,即耳间时间差(Interaural Time Difference,ITD)和耳间强度差(Interaural Intensity Difference,IID)作为深度学习的输入,将水平面划分为四个象限,缩小定位范围。然后提取头相关传递的第二类特征,即耳间声压差(Interaural Level Difference,ILD)和耳间相位差(Interaural Phase Difference,IPD),最后为了得到更精确的定位,将第一类和第二类的四个特征作为下一个深度学习的输入,从而得到声源定位的方位角。实现在水平面上0度到360度以5度为步长进行72个方位角的精确定位。
-
公开(公告)号:CN109410976B
公开(公告)日:2022-12-16
申请号:CN201811292475.7
申请日:2018-11-01
Applicant: 北京工业大学
IPC: G10L21/0208 , G10L21/0272 , G10L21/0232 , G10L25/30 , G10L25/24
Abstract: 双耳数字助听器中基于双耳声源定位和深度学习的语音增强方法,属于语音信号处理领域。首先使用两级的深度神经网络对目标语音给予精确的定位,j结合空间滤波去除与目标语音方向不同的噪声。使用搭建的延时控制双向长短时记忆深度神经网络与分类器相结合的深度学习模型,以提取的多分辨率听觉倒谱系数为特征输入,经过深度学习的非线性处理能力,将每个含噪语音的时频单元分类为语音时频单元或噪声的时频单元,最后利用语音波形合成算法去除与目标语音相同方向的噪声。该算法不仅去除与目标语音不同方向上的噪声也去除与目标语音方向相同的噪声,最终获得满足耳障者的言可懂度和舒适度的增强语音。所有的深度学习模型都采用线下训练,满足实时性。
-
公开(公告)号:CN109410976A
公开(公告)日:2019-03-01
申请号:CN201811292475.7
申请日:2018-11-01
Applicant: 北京工业大学
IPC: G10L21/0208 , G10L21/0272 , G10L21/0232 , G10L25/30 , G10L25/24
Abstract: 双耳数字助听器中基于双耳声源定位和深度学习的语音增强方法,属于语音信号处理领域。首先使用两级的深度神经网络对目标语音给予精确的定位,j结合空间滤波去除与目标语音方向不同的噪声。使用搭建的延时控制双向长短时记忆深度神经网络与分类器相结合的深度学习模型,以提取的多分辨率听觉倒谱系数为特征输入,经过深度学习的非线性处理能力,将每个含噪语音的时频单元分类为语音时频单元或噪声的时频单元,最后利用语音波形合成算法去除与目标语音相同方向的噪声。该算法不仅去除与目标语音不同方向上的噪声也去除与目标语音方向相同的噪声,最终获得满足耳障者的言可懂度和舒适度的增强语音。所有的深度学习模型都采用线下训练,满足实时性。
-
公开(公告)号:CN108122559A
公开(公告)日:2018-06-05
申请号:CN201711397816.2
申请日:2017-12-21
Applicant: 北京工业大学
Abstract: 本发明公开一种数字助听器中基于深度学习的双耳声源定位方法,首先将双耳声源信号通过gammatone滤波器分解成若干信道,通过加权系数提取高能量的信道,接着利用头相关函数(head-related-transform function,HRTF)提取第一类特征,即耳间时间差(Interaural Time Difference,ITD)和耳间强度差(Interaural Intensity Difference,IID)作为深度学习的输入,将水平面划分为四个象限,缩小定位范围。然后提取头相关传递的第二类特征,即耳间声压差(Interaural Level Difference,ILD)和耳间相位差(Interaural Phase Difference,IPD),最后为了得到更精确的定位,将第一类和第二类的四个特征作为下一个深度学习的输入,从而得到声源定位的方位角。实现在水平面上0度到360度以5度为步长进行72个方位角的精确定位。
-
-
-