- 专利标题: 一种基于掩膜映射和混合空洞卷积网络的语音增强方法
-
申请号: CN202111192259.7申请日: 2021-10-13
-
公开(公告)号: CN113936681B公开(公告)日: 2024-04-09
- 发明人: 周琳 , 陈惜金 , 吴超燕 , 钟秋月
- 申请人: 东南大学
- 申请人地址: 江苏省南京市江宁区东南大学路2号
- 专利权人: 东南大学
- 当前专利权人: 东南大学
- 当前专利权人地址: 江苏省南京市江宁区东南大学路2号
- 代理机构: 南京瑞弘专利商标事务所
- 代理商 孙建朋
- 主分类号: G10L21/0208
- IPC分类号: G10L21/0208 ; G10L21/0264 ; G10L25/30 ; G06F17/16 ; G06F18/214 ; G06N3/0464 ; G06N3/084
摘要:
本发明公开了一种基于掩膜映射和混合空洞卷积网络的语音增强方法。本方法在训练阶段,预处理后的含噪语音信号进行短时傅里叶变换,得到对数功率谱,同时计算理想比值掩膜。将若干帧的对数功率谱组成二维对数功率图谱,作为混合空洞卷积网络的输入特征,将对应帧的理想比值掩膜组成二维理想比值掩膜矩阵,作为训练目标,对混合空洞卷积网络进行训练,得到混合空洞卷积网络回归器;测试过程中,利用训练好的混合空洞卷积网络回归器,将含噪测试语音的二维对数功率图谱映射为二维估计比值掩膜矩阵,结合含噪语音的对数功率谱和相位信息,进行逆变换得到重构的语音信号,实现语音增强。本发明提高了语音的感知质量,且算法兼具鲁棒性与泛化性。
公开/授权文献
- CN113936681A 一种基于掩膜映射和混合空洞卷积网络的语音增强方法 公开/授权日:2022-01-14