-
公开(公告)号:CN113539293B
公开(公告)日:2023-12-26
申请号:CN202110911979.8
申请日:2021-08-10
Applicant: 南京邮电大学
IPC: G10L21/0272 , G10L21/0308 , G10L25/03 , G10L25/24 , G10L25/30 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于卷积神经网络和联合优化的单通道语音分离方法,属于语音分离技术领域,包括对语音信号进行预处理,提取单个信号和混合语音信号的幅度谱特征,并计算多通道特征和目标信号的理想浮值掩蔽;将多通道特征输入卷积神经网络,并提取深度特征;将深度特征和多通道特征进行融合,作为全连接层的输入,输出为目标信号的理想浮值掩蔽,并进行参数寻优以训练卷积神经网络;将混合语音信号输入训练后的卷积神经网络,以实现对混合语音信号进行分离。本发明通过将混合幅度谱特征与深度特征在融合层进行融合来训练分离模型,使输入特征所包含的语音信息更加的丰富;对网络参数进行联合优化,使得分离语音的清晰度和可懂度大幅提高。
-
公开(公告)号:CN113539293A
公开(公告)日:2021-10-22
申请号:CN202110911979.8
申请日:2021-08-10
Applicant: 南京邮电大学
IPC: G10L21/0272 , G10L21/0308 , G10L25/03 , G10L25/24 , G10L25/30 , G06N3/04
Abstract: 本发明公开了一种基于卷积神经网络和联合优化的单通道语音分离方法,属于语音分离技术领域,包括对语音信号进行预处理,提取单个信号和混合语音信号的幅度谱特征,并计算多通道特征和目标信号的理想浮值掩蔽;将多通道特征输入卷积神经网络,并提取深度特征;将深度特征和多通道特征进行融合,作为全连接层的输入,输出为目标信号的理想浮值掩蔽,并进行参数寻优以训练卷积神经网络;将混合语音信号输入训练后的卷积神经网络,以实现对混合语音信号进行分离。本发明通过将混合幅度谱特征与深度特征在融合层进行融合来训练分离模型,使输入特征所包含的语音信息更加的丰富;对网络参数进行联合优化,使得分离语音的清晰度和可懂度大幅提高。
-
公开(公告)号:CN117912482A
公开(公告)日:2024-04-19
申请号:CN202311641887.8
申请日:2023-12-01
Applicant: 南京邮电大学
IPC: G10L21/0272 , G10L25/30
Abstract: 本发明公开了一种基于全卷积神经网络多任务学习的时域语音分离方法,该方法在语音分离支路构建全卷积神经网络,网络的输入和目标分别采用时域混合语音和纯净语音,运用卷积编码器和反卷积解码器完成端到端的语音分离。另外,将混合语音性别组合检测任务整合到语音分离网络中,在两个任务联合约束下获取辅助信息特征和语音分离特征,并将这些深度特征相结合来提升语音分离质量。该时域语音分离方法不仅不需要进行相位恢复和频域到时域的重构,而且可以从混合语音性别组合检测任务中提取有效的辅助信息特征,实现更有效的语音分离。最后对所提出的方法进行性能评估,实验表明,相比单任务的语音分离方法,本发明方法性能更佳。
-
公开(公告)号:CN115862661A
公开(公告)日:2023-03-28
申请号:CN202211352869.3
申请日:2022-11-01
Applicant: 南京邮电大学
IPC: G10L21/0272 , G10L21/0308 , G10L25/30 , G10L25/24 , G10L25/03 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了基于双支路卷积神经网络融合模型的盲语音分离方法,包括获取盲语音信号和盲语音信号幅度谱,所述盲语音信号为双混合语音信号;预处理获取的盲语音信号,并根据双支路卷积神经网络融合模型提取盲语音信号的深度融合特征;根据盲语音信号的深度融合特征,利用分类器给盲语音信号打标;将盲语音信号幅度谱输入与打标标签匹配的语音分离模型,获得目标语音信号,完成盲语音分离。本发明能够分离双混合语音信号。
-
-
-