-
公开(公告)号:CN107274916B
公开(公告)日:2021-08-20
申请号:CN201710439537.1
申请日:2012-12-05
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G10L25/54 , G10L17/22 , G06F16/632 , G06F16/783
Abstract: 本发明公开一种基于声纹信息对音/视频文件进行操作的方法,包括如下步骤:采集发声目标的声纹信息;以及根据所述声纹信息搜索音/视频文件。本发明还提供了一种终端设备。本发明提出的技术方案,能够根据特定联系人的声纹信息对音/视频文件进行分类,当用户想找到包含有特定联系人的音/视频文件,不必一个一个文件的播放查看,而是直接进行选择,从而方便用户查找含有特定人员声音的音视频文件。进一步地,本发明提供的基于声纹信息对音/视频文件进行操作的方法可以直接跳转到音/视频中某个联系人说话的时间节点进行播放,从而提供用户的搜索效率。
-
公开(公告)号:CN103035247A
公开(公告)日:2013-04-10
申请号:CN201210518118.4
申请日:2012-12-05
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本发明公开一种基于声纹信息对音/视频文件进行操作的方法,包括如下步骤:采集发声目标的声纹信息;以及根据所述声纹信息搜索音/视频文件。本发明还提供了一种终端设备。本发明提出的技术方案,能够根据特定联系人的声纹信息对音/视频文件进行分类,当用户想找到包含有特定联系人的音/视频文件,不必一个一个文件的播放查看,而是直接进行选择,从而方便用户查找含有特定人员声音的音视频文件。进一步地,本发明提供的基于声纹信息对音/视频文件进行操作的方法可以直接跳转到音/视频中某个联系人说话的时间节点进行播放,从而提供用户的搜索效率。
-
公开(公告)号:CN103295575B
公开(公告)日:2019-01-25
申请号:CN201210048232.5
申请日:2012-02-27
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本发明提供了一种语音识别方法,该方法包括:客户端判断当前的语音识别应用是否涉及隐私,如果是,则由客户端对采集到的语音信号进行语音识别;否则,进一步判断与服务器是否成功建立连接,如果成功建立连接,由服务器对采集到的语音信号进行语音识别;如果不成功建立连接,由客户端对采集到的语音信号进行语音识别。本发明同时公开了一种语音识别中的客户端,应用本发明所述的语音识别方法和客户端,能够实现对包含隐私的语音数据进行语音识别,且不受网络条件是否支持的限制。
-
公开(公告)号:CN102236639B
公开(公告)日:2016-08-10
申请号:CN201010171102.1
申请日:2010-04-28
Applicant: 三星电子株式会社 , 北京三星通信技术研究有限公司
Abstract: 本发明提供了一种更新语言模型的系统和方法。所述系统包括:本地文集产生单元,通过使用输入到移动装置的文本数据和移动装置接收的文本数据来产生本地文集;和LM更新单元,基于本地文集更新移动装置中预先安装的初始LM。本发明解决了现有技术中的LM和应用需求之间的不匹配的问题,根据本发明的更新LM的系统和方法能够根据特定用户的语言习惯和关心的话题以及出现的语言现象动态并经常更新LM。
-
公开(公告)号:CN104836720A
公开(公告)日:2015-08-12
申请号:CN201410048523.3
申请日:2014-02-12
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: H04L12/58
Abstract: 提出了一种交互式通信中进行信息推荐的方法,包括以下步骤:检测用户的输入,并接收用户输入的通信信息;对通信信息进行分析,预测与通信信息相关联的信息;将相关联的信息提供给用户。本发明实施例还提出了一种交互式通信中进行信息推荐的装置。本发明提供的技术方案,在用户聊天交互过程时,通过对聊天内容自动、实时地进行分析,并推测用户实际语义及用户感兴趣的话题,以获取相关信息,根据分析结果向用户推荐多种形式的多媒体信息,从而达到提高沟通效率、丰富聊天体验和减少语义误解的目的。
-
公开(公告)号:CN102237086A
公开(公告)日:2011-11-09
申请号:CN201010173715.9
申请日:2010-04-28
Applicant: 三星电子株式会社 , 北京三星通信技术研究有限公司
Abstract: 提供了一种用于语音识别设备的补偿装置和方法,所述补偿装置包括:模型训练模块,使用期望最大化算法对预置声学模型执行训练,输出非特定说话人的声学模型;全局补偿模块,使用声学模型对影响声学数据的特性的特定域和特定装置进行补偿,输出全局适应的声学模型;目标补偿模块,使用全局适应的声学模型对特定说话人的变化进行补偿,输出说话人适应的声学模型;环境补偿模块,使用说话人适应的声学模型对特定环境的变化进行补偿,输出环境适应的声学模型。
-
公开(公告)号:CN107274916A
公开(公告)日:2017-10-20
申请号:CN201710439537.1
申请日:2012-12-05
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
CPC classification number: G10L25/54 , G06F17/30755 , G06F17/30787 , G10L17/22
Abstract: 本发明公开一种基于声纹信息对音/视频文件进行操作的方法,包括如下步骤:采集发声目标的声纹信息;以及根据所述声纹信息搜索音/视频文件。本发明还提供了一种终端设备。本发明提出的技术方案,能够根据特定联系人的声纹信息对音/视频文件进行分类,当用户想找到包含有特定联系人的音/视频文件,不必一个一个文件的播放查看,而是直接进行选择,从而方便用户查找含有特定人员声音的音视频文件。进一步地,本发明提供的基于声纹信息对音/视频文件进行操作的方法可以直接跳转到音/视频中某个联系人说话的时间节点进行播放,从而提供用户的搜索效率。
-
公开(公告)号:CN103035247B
公开(公告)日:2017-07-07
申请号:CN201210518118.4
申请日:2012-12-05
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本发明公开一种基于声纹信息对音/视频文件进行操作的方法,包括如下步骤:采集发声目标的声纹信息;以及根据所述声纹信息搜索音/视频文件。本发明还提供了一种终端设备。本发明提出的技术方案,能够根据特定联系人的声纹信息对音/视频文件进行分类,当用户想找到包含有特定联系人的音/视频文件,不必一个一个文件的播放查看,而是直接进行选择,从而方便用户查找含有特定人员声音的音视频文件。进一步地,本发明提供的基于声纹信息对音/视频文件进行操作的方法可以直接跳转到音/视频中某个联系人说话的时间节点进行播放,从而提供用户的搜索效率。
-
公开(公告)号:CN103377651B
公开(公告)日:2015-12-16
申请号:CN201210133630.7
申请日:2012-04-28
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G10L13/047
Abstract: 本发明公开一种语音自动合成装置,包括:提取模块,用于从语音通话中自动提取出语音数据;增强检测模块,用于自动区分所述语音数据中的多个人的语音,对区分后的语音数据进行归类,并且动态更新归类后的语音数据;综合标注模块,用于自动标注经归类后的语音数据,并且生成标注信息;验证筛选模块,用于筛选出符合预定标准的语音数据,并且通过模型变换生成对应的合成模型;以及语音合成模块,用于根据所述合成模型输出相应用户的语音。本发明提供的语音自动合成装置具备周期短、成本低且能够自动积累。
-
公开(公告)号:CN102682763B
公开(公告)日:2014-07-16
申请号:CN201110063938.4
申请日:2011-03-10
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
CPC classification number: G10L15/22 , G10L15/08 , G10L15/1815 , G10L2015/221
Abstract: 本发明公开了修正语音输入文本中命名实体词汇的方法及装置,有针对性的定位识别错误的命名实体词汇,而不是对用户输入的每个词汇是否识别错误都进行判断,同时提供了包括使用从预设的本地命名实体库和/或网络资源中选择的词汇、及使用用户重新输入的词汇进行修正的修正模式,与现有技术中仅通过多模态的文字输入进行修正相比,修正途径更加便捷、丰富。
-
-
-
-
-
-
-
-
-