-
公开(公告)号:CN119278478A
公开(公告)日:2025-01-07
申请号:CN202380046119.X
申请日:2023-05-31
Applicant: 三星电子株式会社
Abstract: 一种方法包括:获得包含语音活动的音频流的至少一部分,其中,所述音频流的至少所述部分包括多个分段;生成表示所述多个分段中的每个分段的嵌入向量;在局部窗口中的每一个内,将所述嵌入向量聚类成一个或多个聚类以执行说话者识别,其中,不同的聚类对应于不同的说话者;基于针对所述局部窗口中的每一个执行的所述说话者识别来呈现至少一个第一说话者标识序列;在全局窗口中的每一个内,将所述嵌入向量聚类成一个或多个聚类以执行说话者识别,其中,所述全局窗口中的每一个比所述局部窗口中的每一个长;以及基于针对所述全局窗口中的每一个执行的所述说话者识别来呈现至少一个第二说话者标识序。
-
公开(公告)号:CN119522454A
公开(公告)日:2025-02-25
申请号:CN202380052221.0
申请日:2023-06-29
Applicant: 三星电子株式会社
IPC: G10L25/87 , G10L15/04 , G10L15/10 , G10L15/26 , G06F40/279
Abstract: 公开了一种确定结束点检测(EPD)时间的方法和用于执行该方法的电子设备。根据实施例的电子设备包括:处理器;以及存储器,该存储器电连接到处理器并且存储由处理器执行的指令,其中,当指令被执行时,处理器识别话语,基于存储在存储器中的话语数据来确定用于终止对话语的识别的结束点检测(EPD)时间,并且当在结束点检测时间内没有输入另外的用户话语时终止对话语的识别,其中话语数据可以包括句子数据和词数据,句子数据包括与话语的句子类型相关的模式,词数据包括话语的词。
-
公开(公告)号:CN116868266A
公开(公告)日:2023-10-10
申请号:CN202280013646.6
申请日:2022-02-04
Applicant: 三星电子株式会社
Inventor: 崔明用 , 戈达瓦里·苏达卡尔·拉奥 , 兰詹·库马尔·萨马尔 , 金大山 , 吴爀 , 崔俊劝 , 普里亚达尔希尼·帕内曼格洛尔·派尔 , 拉胡尔·库马尔 , 维耶塔·古尔 , 朴成宰 , 柳承范
IPC: G10L15/26
Abstract: 本公开的各个实施例涉及一种在能够执行自然语言处理的电子设备中支持自动语音识别的装置及其操作方法。为此,所述电子设备可以基于从输入音频信号顺序地识别的一个或更多个部分文本,来识别从麦克风输入的音频信号的语音类型。所述电子设备能够基于语音类型自适应地确定保持时间,并且通过应用所确定的保持时间来检测所述音频信号的语音结束。
-
-