-
公开(公告)号:CN107993670A
公开(公告)日:2018-05-04
申请号:CN201711201341.5
申请日:2017-11-23
Applicant: 华南理工大学
IPC: G10L19/02 , G10L19/26 , G10L21/0216 , G10L21/0232 , G10L21/0272
Abstract: 本发明公开了基于统计模型的麦克风阵列语音增强方法。该方法先建立用于语音帧分类的干净语音模型,并计算出对应于每个分类的干净语音线性频谱模型;将麦克风阵列接收的信号分为两条支路,主支路采用GSC的固定波束形成器对期望方向的信号进行增强,得到初步增强的语音yc,辅助支路通过GSC的阻塞矩阵和自适应抵消器后,得到噪声分量yn;从辅助支路的信号中估计噪声模型及噪声的线性频谱模型;对yc分帧,利用噪声模型和干净语音模型对每帧语音进行分类;根据分类结果,利用干净语音线性频谱模型和噪声的线性频谱模型构造最佳滤波器;用最佳滤波器对yc进行滤波,获得增强后的语音。本发明提高了输出语音的听觉质量,可在具有嘈杂背景的语音通信中应用。
-
公开(公告)号:CN107993670B
公开(公告)日:2021-01-19
申请号:CN201711201341.5
申请日:2017-11-23
Applicant: 华南理工大学
IPC: G10L19/02 , G10L19/26 , G10L21/0216 , G10L21/0232 , G10L21/0272
Abstract: 本发明公开了基于统计模型的麦克风阵列语音增强方法。该方法先建立用于语音帧分类的干净语音模型,并计算出对应于每个分类的干净语音线性频谱模型;将麦克风阵列接收的信号分为两条支路,主支路采用GSC的固定波束形成器对期望方向的信号进行增强,得到初步增强的语音yc,辅助支路通过GSC的阻塞矩阵和自适应抵消器后,得到噪声分量yn;从辅助支路的信号中估计噪声模型及噪声的线性频谱模型;对yc分帧,利用噪声模型和干净语音模型对每帧语音进行分类;根据分类结果,利用干净语音线性频谱模型和噪声的线性频谱模型构造最佳滤波器;用最佳滤波器对yc进行滤波,获得增强后的语音。本发明提高了输出语音的听觉质量,可在具有嘈杂背景的语音通信中应用。
-