-
公开(公告)号:CN110299150A
公开(公告)日:2019-10-01
申请号:CN201910549060.1
申请日:2019-06-24
Applicant: 中国科学院计算技术研究所
IPC: G10L21/0272 , G10L15/06 , G10L15/04
Abstract: 本发明公开了一种实时语音说话人分离方法及系统,该方法包括以下步骤:获取语音片段,对所述语音片段对应的说话人进行分类,获得与其匹配的通用背景模型;对所述语音片段进行特征提取,基于所提取特征和所述通用背景模型建立说话人临时模型;将所建立的说话人临时模型与已有同类说话人模型进行比对,判断所述说话人是否为已有说话人,并基于判断结果进行说话人模型的更新。本发明能满足说话人分离任务实时在智能终端设备上的执行;可扩展智能终端设备的能力,更快得到说话人分离的结果;节约了由于网络传输带来的延迟,并减少随着智能终端设备增多给网络带来的传输负担。