-
公开(公告)号:CN118284930A
公开(公告)日:2024-07-02
申请号:CN202280069354.4
申请日:2022-10-12
Applicant: 三星电子株式会社
Inventor: 维延德拉·拉吉·埃普斯格卡 , 金明锺 , 安尼尔·亚达夫
IPC: G10L15/16 , G10L15/22 , G10L15/26 , G10L15/02 , G06F40/279
Abstract: 提供了一种方法和装置。所述方法包括:获得音频输入,在所述音频输入未被音频识别模型识别的情况下,获得上下文信息,确定所述上下文信息是否对应于所述音频输入,以及在所述上下文信息对应于所述音频输入的情况下,基于所述上下文信息和所述音频输入执行与所述音频识别模型相关联的神经网络的训练。
-
公开(公告)号:CN118355436A
公开(公告)日:2024-07-16
申请号:CN202280077165.1
申请日:2022-11-30
Applicant: 三星电子株式会社
Inventor: 金明钟 , 维延德拉·拉吉·埃普斯格卡 , 迪亚·尼拉吉里 , 奇泰延
IPC: G10L17/18 , G10L15/00 , G10L21/0272 , G10L15/16
Abstract: 一种用于处理语音数据的设备可包括被配置为进行以下操作的处理器:从输入语音分离语音信号;识别从所述输入语音分离的所述语音信号中的每一个语音信号的语言;使用至少一个神经网络,基于所述语音信号中的每一个语音信号的语言从所述语音信号中提取说话人嵌入,其中,所述至少一个神经网络被配置为接收所述语音信号并输出所述说话人嵌入;以及通过迭代地聚类所述说话人嵌入来识别所述语音信号中的每一个语音信号的说话人。
-