-
公开(公告)号:CN112992131A
公开(公告)日:2021-06-18
申请号:CN202110155034.8
申请日:2021-02-04
Applicant: 南京邮电大学
IPC: G10L15/20 , G10L15/22 , G10L15/26 , G10L21/0208 , G10L21/0272 , G10L17/00 , G10L17/22
Abstract: 本发明公开了一种在复杂场景下提取目标人声的乒乓球指令的方法,建立一个语音分离的系统,该系统包括三个部分,一是语音降噪,二是语音分离,三是声纹识别。对一个由多重噪声干扰的声音,首先经过语音降噪的处理,将环境噪声给去除。下一阶段的目标就是将目标语音和其他不同人说话的声音分离开。我们将语音传入到语音分离的系统当中进行处理,在语音分离的系统中会对语音进行分离,输出的是分离之后的各个不同人说话的语音。最后一步就是识别出分离出来的语音哪个是我们所需要的,我们采用声纹识别的方式,来获取我们所需要的语音。在此之前我们已经记录了用户的声纹,我们一一进行对比,就可以获得相对纯净的,没有干扰的目标语音。