-
公开(公告)号:CN116612779A
公开(公告)日:2023-08-18
申请号:CN202310620353.0
申请日:2023-05-29
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G10L21/0272 , G10L25/30 , G06N3/08
Abstract: 本发明提供一种基于深度学习的单通道语音分离的方法,包括以下步骤:步骤1,编码阶段:接收单个麦克风采集的混合语音信号,并将所接收的混合语音信号的时域波形划分为多个短段,再将多个短段转换为中间特征空间中对应的高维特征表示输出到下一步骤;步骤2,分离阶段:接收步骤1的高维特征表示并输出每个源信号对应的掩蔽估计,进而在特征空间中得到分离源的特征表示,以实现分离,从而得到分离特征,将分离特征输出到下一步骤;步骤3,解码阶段:接收步骤2输出的分离特征并将其转换为对应源信号的时域波形估计。本发明的有益效果是:1.本发明方法提升了语音分离的性能。