-
公开(公告)号:CN102903362A
公开(公告)日:2013-01-30
申请号:CN201210320230.7
申请日:2012-08-31
Applicant: 微软公司
Abstract: 本发明描述了集成的本地和基于云的语音识别。描述了一种用于将本地语音识别与基于云的语音识别集成以提供高效的自然用户界面的系统。在一些实施例中,计算设备确定与环境中的特定人相关联的方向,并生成与该方向相关联的音频记录。该计算设备然后对该音频记录执行本地语音识别以检测该特定人说出的第一话语并检测该第一话语中的一个或多个关键字。该第一话语可通过对音频记录应用话音活动检测技术来检测。该第一话语以及一个或多个关键字随后被传送至服务器,该服务器可标识第一话语中与该一个或多个关键字相关联的语音,并基于所标识的语音来使一种或多种语音识别技术进行适应。
-
公开(公告)号:CN102306051A
公开(公告)日:2012-01-04
申请号:CN201110177728.8
申请日:2011-06-17
Applicant: 微软公司
IPC: G06F3/01
CPC classification number: G06F3/017 , G06F3/038 , G06F3/167 , G06F2203/0381
Abstract: 本发明涉及复合姿势-语音命令。一种多媒体娱乐系统将姿势和语音命令组合以提供增强的控制方案。用户的身体位置或运动可被识别为姿势,且可被用于提供用于识别用户生成的声音(诸如语音输入)的上下文。同样,语音输入可被识别为语音命令,且可被用于提供用于将身体位置或运动识别为姿势的上下文。权重可被赋给这些输入以促进处理。当姿势被识别出时,加载与识别出的姿势相关联的语音命令的有限集合以供使用。此外,语音命令的附加集合可按分层方式被结构化,以使得说出来自语音命令的一个集合的语音命令导致系统加载下一集合的语音命令。
-