-
公开(公告)号:CN118284932A
公开(公告)日:2024-07-02
申请号:CN202280076890.7
申请日:2022-11-28
Applicant: 三星电子株式会社
Inventor: 金明锺 , 维坚德拉·拉杰·安普辛格卡尔 , 艾维亚乐·安舒 , 奇泰延
IPC: G10L17/02 , G10L17/18 , G10L25/18 , G10L17/04 , G10L21/0272
Abstract: 一种用于处理语音数据的装置可包括:处理器,被配置为:将输入语音分离成语音信号;识别语音信号中的每个语音信号的带宽;使用被配置为接收语音信号并输出说话人嵌入的至少一个神经网络,基于语音信号中的每个语音信号的带宽从语音信号中提取说话人嵌入;以及将说话人嵌入聚类为一个或更多个说话人聚类,其中,每个说话人聚类与说话人标识对应。
-
公开(公告)号:CN118284930A
公开(公告)日:2024-07-02
申请号:CN202280069354.4
申请日:2022-10-12
Applicant: 三星电子株式会社
Inventor: 维延德拉·拉吉·埃普斯格卡 , 金明锺 , 安尼尔·亚达夫
IPC: G10L15/16 , G10L15/22 , G10L15/26 , G10L15/02 , G06F40/279
Abstract: 提供了一种方法和装置。所述方法包括:获得音频输入,在所述音频输入未被音频识别模型识别的情况下,获得上下文信息,确定所述上下文信息是否对应于所述音频输入,以及在所述上下文信息对应于所述音频输入的情况下,基于所述上下文信息和所述音频输入执行与所述音频识别模型相关联的神经网络的训练。
-