-
公开(公告)号:CN110088833B
公开(公告)日:2024-04-09
申请号:CN201780078456.1
申请日:2017-12-14
Applicant: 三星电子株式会社
Abstract: 提供了一种语音识别方法和语音识别装置,其预先下载预测使用的语音识别模型并在语音识别中使用语音识别模型。所述语音识别方法,由所述语音识别装置执行,包括:基于用户信息确定语音识别模型,下载语音识别模型,基于语音识别模型执行语音识别,以及输出执行语音识别的结果。
-
公开(公告)号:CN113140215A
公开(公告)日:2021-07-20
申请号:CN202110527107.1
申请日:2015-01-16
Applicant: 三星电子株式会社
IPC: G10L15/14 , G10L15/02 , G10L15/06 , G10L15/187 , G10L15/197 , G10L15/28
Abstract: 本申请公开了执行用户语音的语音识别的方法和电子设备。该电子设备包括:存储器,存储计算机可读指令;以及至少一个处理器,当运行计算机可读指令时,被配置为:获得基于由所述电子设备检测到的用户语音的第一音频数据,获得基于由第二电子设备检测到的用户语音的第二音频数据,确定第一音频数据的第一音频质量,确定第二音频数据的第二音频质量,基于第一音频质量和第二音频质量,选择第一音频数据和第二音频数据中的音频数据,选择所述电子设备和第二电子设备中的获得所选择的音频数据的电子设备,基于所选择的音频数据,执行用户语音的语音识别,并且在所选择的电子设备输出语音识别的结果。
-
公开(公告)号:CN111418008A
公开(公告)日:2020-07-14
申请号:CN201880077091.5
申请日:2018-11-29
Applicant: 三星电子株式会社
Abstract: 提供了一种语音辨识设备。语音辨识设备包括:至少一个麦克风,其被配置为从第一声源接收声音信号;以及至少一个处理器,其被配置为基于声音信号来确定第一声源的方向,确定第一声源的方向是否位于登记的方向上,以及基于第一声源的方向是否位于登记的方向上,从声音信号中辨识语音,而不管声音信号是否包括唤醒关键字。
-
公开(公告)号:CN103839545A
公开(公告)日:2014-06-04
申请号:CN201310603916.1
申请日:2013-11-25
Applicant: 三星电子株式会社 , 戴尔莫尔感知人工智能研究所
IPC: G10L15/06
CPC classification number: G06F17/289 , G10L15/00
Abstract: 提供了一种用于构建多语言声学模型的设备和方法。用于构建多语言声学模型的方法包括:将输入特征划分为共同语言部分和区别语言部分,通过使用神经网络训练划分的共同语言部分和区别语言部分以估计和去除音素之间的相关性来获得串联特征,将使用串联特征构建的初始声学模型的参数划分为共同语言参数和区别语言参数,使用训练语言的数据适应于共同语言参数,使用目标语言的数据适应于区别语言参数,并使用适应的共同语言参数和适应的区别语言参数来构建针对目标语言的声学模型。
-
公开(公告)号:CN101415259A
公开(公告)日:2009-04-22
申请号:CN200710182354.2
申请日:2007-10-18
Applicant: 三星电子株式会社 , 北京三星通信技术研究有限公司
Abstract: 提供了一种基于双语语音查询的信息检索的系统和方法。所述系统包括:特征提取器,将语音信号从PCM波形转换到MFCC特征参数,并在噪声抑制和帧压缩处理之后输出压缩的MFCC数据流;双语音素识别器,接收压缩的MFCC数据流,并通过将英语或者汉语语音自动转换到文本音素串来执行语音识别;双语文字音素转换器,将用于MP3 ID3标签数据库中的MP3文档的语音检索的可用内容的文字级的串转换成作为参考音素串的音素级的串;词汇比较器,将从双语音素识别器产生的识别的音素串和从双语文字音素转换器产生的参考音素串相比较,并输出最相关的前N个参考音素串。
-
公开(公告)号:CN107112010B
公开(公告)日:2021-06-01
申请号:CN201580073696.3
申请日:2015-01-16
Applicant: 三星电子株式会社
IPC: G10L15/197 , G10L15/28
Abstract: 本申请公开了一种更新包括用于语音识别的语言模型的语音识别数据的方法,所述方法包括:获取包括至少一个字的语言数据;从至少一个字当中检测不存在于语言模型中的字;获取关于检测到的字的至少一个音素序列;通过将至少一个音素序列划分成预定单元分量来获取构成至少一个音素序列的分量;确定关于在语音识别期间构成至少一个音素序列中的每一个的各个分量出现的概率的信息;以及基于所确定的概率信息来更新语言模型。
-
公开(公告)号:CN111684521A
公开(公告)日:2020-09-18
申请号:CN201980011477.0
申请日:2019-01-31
Applicant: 三星电子株式会社
Abstract: 一种在电子装置中处理语音信号以用于说话者识别的方法,包括:获得第一用户的语音信号;从语音信号中提取包括特征值的语音特征;将从第一用户的语音信号中提取的语音特征与预定参考值进行比较;选择对应于与参考值进行比较的第一用户的语音特征的第一用户特征;基于第一用户特征生成用于说话者识别的推荐短语;以及输出推荐短语。
-
-
公开(公告)号:CN102640084B
公开(公告)日:2016-03-02
申请号:CN201080053726.1
申请日:2010-11-09
Applicant: 三星电子株式会社
CPC classification number: G10L15/22 , G10L17/10 , G10L2015/223 , G10L2015/227
Abstract: 提供了一种用于系统和多个用户的通信接口设备。所述用于系统和多个用户的通信接口设备包括:第一处理单元,被构造为从至少一个用户接收语音信息和脸部信息,并基于与各接收的语音信息和脸部信息相应的用户模型来确定接收的语音信息是否是至少一个注册用户的语音信息;第二处理单元,被构造为接收脸部信息,并基于接收的脸部信息来确定所述至少一个用户的注意力是否在所述系统上;以及第三处理单元,被构造为接收语音信息,分析接收的语音信息,并基于以情境为基础表示会话流的对话模型来确定接收的语音信息是否对所述系统具有实际意义。
-
公开(公告)号:CN101515456A
公开(公告)日:2009-08-26
申请号:CN200810008192.5
申请日:2008-02-18
Applicant: 三星电子株式会社 , 北京三星通信技术研究有限公司
Abstract: 提供了一种语音识别接口装置及其语音识别方法。所述语音识别接口装置包括模型参数估计器和语音识别器,模型参数估计器从外部语音数据库提取目标语言和母语的声学信息,分别训练得到目标语言的声学模型和母语的声学模型,再分别对所述两种声学模型应用模型自适应技术,然后应用高斯成分归并技术得到背景模型;语音识别器分别接收从模型参数估计器输入的背景模型及从外部输入的非母语语音,基于背景模型对输入的非母语语音进行识别。根据本发明,可以提高非母语语音的识别正确率。
-
-
-
-
-
-
-
-
-