一种基于掩膜映射和混合空洞卷积网络的语音增强方法
摘要:
本发明公开了一种基于掩膜映射和混合空洞卷积网络的语音增强方法。本方法在训练阶段,预处理后的含噪语音信号进行短时傅里叶变换,得到对数功率谱,同时计算理想比值掩膜。将若干帧的对数功率谱组成二维对数功率图谱,作为混合空洞卷积网络的输入特征,将对应帧的理想比值掩膜组成二维理想比值掩膜矩阵,作为训练目标,对混合空洞卷积网络进行训练,得到混合空洞卷积网络回归器;测试过程中,利用训练好的混合空洞卷积网络回归器,将含噪测试语音的二维对数功率图谱映射为二维估计比值掩膜矩阵,结合含噪语音的对数功率谱和相位信息,进行逆变换得到重构的语音信号,实现语音增强。本发明提高了语音的感知质量,且算法兼具鲁棒性与泛化性。
0/0