-
公开(公告)号:CN106373589B
公开(公告)日:2019-07-26
申请号:CN201610824648.X
申请日:2016-09-14
Applicant: 东南大学
IPC: G10L21/0272 , G10L21/0308
Abstract: 本发明公布了一种基于迭代结构的双耳混合语音分离方法。利用双耳空间线索,耳间时间差ITD(Interaural Time Difference)和耳间强度差IID(Interaural Intensity Difference)参数,对混合语音中的多个声源进行初步定位,将初次定位的声源个数和各个声源的空间方位信息作为分离依据,实现基于空间方位信息的各个声源数据流的分离和重构;随后对重构后的语音信号重新估计声源方位,利用修正后的方位信息对混合语音进行再次分离;按照上述步骤重复迭代处理后,将最后一次分离重构的各声源数据流作为最终声源分离结果。在低信噪比和强混响环境下,本发明提出的基于迭代结构和空间信息的双耳语音分离方法相比传统的双耳语音分离方法,显著提高了分离语音的感知质量。
-
公开(公告)号:CN104485103B
公开(公告)日:2017-09-01
申请号:CN201410676529.5
申请日:2014-11-21
Applicant: 东南大学
IPC: G10L15/14
Abstract: 一种基于矢量泰勒级数的多环境模型孤立词识别方法,通过模型训练阶段:设置基本环境信噪比,利用含噪训练语音分别训练生成含噪GMM模型和含噪HMM模型;通过孤立词识别阶段,根据训练阶段获得的含噪GMM模型,首先选择与当前测试环境最匹配的信噪比环境;其次基于矢量泰勒级数和纯净环境下的纯净GMM模型,估计测试语音中噪声的均值和方差,并根据最小均方误差准则将测试语音特征参数映射到最匹配信噪比环境下的含噪语音特征参数;最后,选择最匹配信噪比环境下的含噪HMM模型,将映射后的含噪特征参数与对应的含噪HMM模型进行匹配,得到最终的识别结果。本发明误识率比现有矢量泰勒级数大幅降低。
-
公开(公告)号:CN104485103A
公开(公告)日:2015-04-01
申请号:CN201410676529.5
申请日:2014-11-21
Applicant: 东南大学
IPC: G10L15/14
Abstract: 一种基于矢量泰勒级数的多环境模型孤立词识别方法,通过模型训练阶段:设置基本环境信噪比,利用含噪训练语音分别训练生成含噪GMM模型和含噪HMM模型;通过孤立词识别阶段,根据训练阶段获得的含噪GMM模型,首先选择与当前测试环境最匹配的信噪比环境;其次基于矢量泰勒级数和纯净环境下的纯净GMM模型,估计测试语音中噪声的均值和方差,并根据最小均方误差准则将测试语音特征参数映射到最匹配信噪比环境下的含噪语音特征参数;最后,选择最匹配信噪比环境下的含噪HMM模型,将映射后的含噪特征参数与对应的含噪HMM模型进行匹配,得到最终的识别结果。本发明误识率比现有矢量泰勒级数大幅降低。
-
公开(公告)号:CN106373589A
公开(公告)日:2017-02-01
申请号:CN201610824648.X
申请日:2016-09-14
Applicant: 东南大学
IPC: G10L21/0272 , G10L21/0308
CPC classification number: G10L21/0272 , G10L21/0308
Abstract: 本发明公布了一种基于迭代结构的双耳混合语音分离方法。利用双耳空间线索,耳间时间差ITD(Interaural Time Difference)和耳间强度差IID(Interaural Intensity Difference)参数,对混合语音中的多个声源进行初步定位,将初次定位的声源个数和各个声源的空间方位信息作为分离依据,实现基于空间方位信息的各个声源数据流的分离和重构;随后对重构后的语音信号重新估计声源方位,利用修正后的方位信息对混合语音进行再次分离;按照上述步骤重复迭代处理后,将最后一次分离重构的各声源数据流作为最终声源分离结果。在低信噪比和强混响环境下,本发明提出的基于迭代结构和空间信息的双耳语音分离方法相比传统的双耳语音分离方法,显著提高了分离语音的感知质量。
-
-
-