-
公开(公告)号:CN110767244B
公开(公告)日:2024-03-29
申请号:CN201810827229.0
申请日:2018-07-25
Applicant: 中国科学技术大学 , 北京三星通信技术研究有限公司
IPC: G10L21/02 , G10L21/0208 , G10L25/30
Abstract: 本发明公开了一种语音增强方法,包括:提取各语音帧的声学特征;利用干净语音的与噪声语音的样本对渐进式双输出神经网络模型进行训练,利用训练后的渐进式双输出神经网络模型估计各语音帧的理想软掩蔽,并进行声学特征的增强处理;如果应用到人耳,则利用增强后的声学特征对波形进行重构,得到可主观测听的波形;如果应用到语音识别系统,则将估计到的理想软掩蔽应用到输入语音的声学特征上上,得到掩蔽后的声学特征,然后对波形进行重构得到增强后的语音。本发明上述方案可以满足人耳降噪需求和提升带噪语音的识别准确率。