-
公开(公告)号:CN119137661A
公开(公告)日:2024-12-13
申请号:CN202380037453.9
申请日:2023-06-01
Applicant: 三星电子株式会社
IPC: G10L17/24 , G10L17/02 , G10L17/06 , G10L25/51 , G10L17/04 , G06N3/0464 , G06N3/0442
Abstract: 一种方法包括获得音频数据并且识别音频数据中的唤醒词或唤醒短语的话语。该方法还包括基于来自音频数据的话语来生成嵌入向量,并且访问表示唤醒词或唤醒短语的先前话语的先前生成向量集合。该方法还包括对嵌入向量和先前生成向量集合执行聚类以识别包括嵌入向量的聚类,其中所识别的聚类与说话者相关联。该方法还包括基于嵌入向量来更新与说话者相关联的说话者向量,并且使用说话者验证模型确定更新的说话者向量和嵌入向量之间的相似度得分。此外,该方法包括基于相似度得分来确定提供话语的说话者是否匹配与所识别的聚类相关联的说话者。