-
公开(公告)号:CN113470662A
公开(公告)日:2021-10-01
申请号:CN202010244661.4
申请日:2020-03-31
申请人: 微软技术许可有限责任公司
摘要: 提供了用于生成和使用文本到语音(TTS)数据以供改进的语音识别模型的系统、方法和设备。利用关键词无关的基线训练数据来训练主模型。在一些实例中,利用新的TTS训练数据来修改主模型的声学和语言模型子组件。在一些实例中,新的TTS训练是从用于在基线训练数据中代表不足的关键词的多说话者神经TTS系统获得的。在一些实例中,新的TTS训练数据被用于关键词检出(KWS)应用中的发音学习和关键词相关置信评分的归一化。在一些实例中,新的TTS训练数据被用于语音识别模型中的快速说话者适配。
-
公开(公告)号:CN105960672B
公开(公告)日:2019-11-26
申请号:CN201480075008.2
申请日:2014-09-09
申请人: 微软技术许可有限责任公司
摘要: 提供了用于结合环境变量的语音识别的系统和方法。该系统包括:语音捕捉设备(202);特征提取模块(204);环境变量模块(206),其中所述环境变量模块确定环境变量的值;以及语音识别解码器(208),其中所述语音识别译码器利用深度神经网络(DNN)来识别由所述语音捕捉装置捕捉的语音,其中所述DNN的一个或多个组件被建模为环境变量的一组函数。
-
公开(公告)号:CN106415444B
公开(公告)日:2019-10-01
申请号:CN201580005721.4
申请日:2015-01-16
申请人: 微软技术许可有限责任公司
IPC分类号: G06F3/01 , G06F3/0484
摘要: 描述了用于实现对虚拟对象的免动手选择的方法。在一些实施例中,注视滑扫姿势可以被用于选择虚拟对象。注视滑扫姿势可涉及头戴式显示设备(HMD)的终端用户执行由HMD跟踪的头部移动以检测终端用户控制的虚拟指针是否已经滑扫跨过虚拟对象的两条或更多条边。在一些情形中,注视滑扫姿势可包括在终端用户注视虚拟对象的同时终端用户使用他们的头部移动来将虚拟指针移动通过虚拟对象的两条边。响应于检测到注视滑扫姿势,HMD可基于注视滑扫姿势的速度和虚拟对象的大小来确定要被显示在HMD上的第二虚拟对象。
-
公开(公告)号:CN106796684A
公开(公告)日:2017-05-31
申请号:CN201580033344.5
申请日:2015-06-19
申请人: 微软技术许可有限责任公司
IPC分类号: G06Q10/10
CPC分类号: G06F3/0482 , G06F3/04842 , G06F3/04847 , G06F3/0485 , G06F3/04855 , G06F3/0486 , G06F3/04883 , G06F17/30867 , G06F17/30964 , G06Q10/109 , G06Q10/1093 , H04L12/1813 , H04L51/08 , H04L67/02
摘要: 提供了从时间线创建日历事件。诸如日历应用之类的应用可以检测用于在时间线上创建事件的创建动作。对包括事件的主题名称以及事件日期的事件的细节进行捕获。基于所述细节来在时间线上显示事件。检测用于保存事件的保存动作。基于所述细节而在与时间线相关联的日历上显示事件。
-
公开(公告)号:CN106462579A
公开(公告)日:2017-02-22
申请号:CN201480077830.2
申请日:2014-10-15
申请人: 微软技术许可有限责任公司
IPC分类号: G06F17/30
摘要: 本文提出了与构造针对限定上下文的词典有关的各种技术。社交媒体文本被获取,其中所述社交媒体文本具有与其对应的上下文数据。社交媒体文本被编码以形成编码文本(Unicode格式),并且上下文数据被指派给该编码文本。通过基于诸如位置之类的上下文数据对编码文本进行过滤来形成针对限定上下文的文本语料库。单词或短语在文本语料库中出现的频率被用于标识要被包括在词典中的单词或短语。
-
公开(公告)号:CN106104423A
公开(公告)日:2016-11-09
申请号:CN201580013497.3
申请日:2015-03-09
申请人: 微软技术许可有限责任公司
IPC分类号: G06F3/01
CPC分类号: G06F3/0346 , G06F3/012 , G06F3/017
摘要: 本文公开了涉及调节配置成接收基于姿势的用户输入的设备的姿势识别特性的各实施例。例如,一个所公开的实施例提供了一种头戴式显示设备,包括:多个传感器;配置成呈现用户界面的显示器;逻辑机;以及存储机,所述存储机保持能由所述逻辑机执行以进行以下的指令:基于从所述多个传感器中的第一传感器接收到的信息来检测姿势,响应于检测到所述姿势来执行动作,以及确定所述姿势是否匹配有意姿势输入。该指令进一步能执行以在确定检测到的姿势不匹配该有意姿势输入的情况下更新定义该有意姿势输入的姿势参数。
-
公开(公告)号:CN105960672A
公开(公告)日:2016-09-21
申请号:CN201480075008.2
申请日:2014-09-09
申请人: 微软技术许可有限责任公司
摘要: 提供了用于结合环境变量的语音识别的系统和方法。该系统包括:语音捕捉设备(202);特征提取模块(204);环境变量模块(206),其中所述环境变量模块确定环境变量的值;以及语音识别解码器(208),其中所述语音识别译码器利用深度神经网络(DNN)来识别由所述语音捕捉装置捕捉的语音,其中所述DNN的一个或多个组件被建模为环境变量的一组函数。
-
公开(公告)号:CN105934730A
公开(公告)日:2016-09-07
申请号:CN201580005760.4
申请日:2015-01-16
申请人: 微软技术许可有限责任公司
IPC分类号: G06F3/01 , G06F3/0485 , H04M1/725
CPC分类号: G06T7/20 , G02B27/0172 , G02B2027/0178 , G06F3/012 , G06F3/013 , G06F3/0485 , G06F2203/04804 , G06T11/60 , G09G5/10 , G09G5/34 , H04M1/72569
摘要: 描述了用于当内容由头戴式显示设备(HMD)的最终用户查看时控制所述内容的显示的方法。在一些实施例中,HMD可以使用用于阅读内容的虚拟内容阅读器来显示内容。所述内容可以包括文本和/或图像,例如与电子书、电子杂志、文字处理文档、网页或电子邮件相关联的文本或图像。虚拟内容阅读器可以基于最终用户阅读在虚拟内容阅读器上所显示的内容的一部分的速率来提供自动内容滚动。在一个实施例中,HMD可以将显示在虚拟内容阅读器上的内容的自动滚动与用户控制的滚动(例如通过HMD的最终用户的头部跟踪)相组合。
-
公开(公告)号:CN106462579B
公开(公告)日:2019-09-27
申请号:CN201480077830.2
申请日:2014-10-15
申请人: 微软技术许可有限责任公司
摘要: 本文提出了与构造针对限定上下文的词典有关的各种技术。社交媒体文本被获取,其中所述社交媒体文本具有与其对应的上下文数据。社交媒体文本被编码以形成编码文本(Unicode格式),并且上下文数据被指派给该编码文本。通过基于诸如位置之类的上下文数据对编码文本进行过滤来形成针对限定上下文的文本语料库。单词或短语在文本语料库中出现的频率被用于标识要被包括在词典中的单词或短语。
-
公开(公告)号:CN105934730B
公开(公告)日:2019-05-10
申请号:CN201580005760.4
申请日:2015-01-16
申请人: 微软技术许可有限责任公司
IPC分类号: G06F3/01 , G06F3/0485 , H04M1/725
摘要: 描述了用于当内容由头戴式显示设备(HMD)的最终用户查看时控制所述内容的显示的方法。在一些实施例中,HMD可以使用用于阅读内容的虚拟内容阅读器来显示内容。所述内容可以包括文本和/或图像,例如与电子书、电子杂志、文字处理文档、网页或电子邮件相关联的文本或图像。虚拟内容阅读器可以基于最终用户阅读在虚拟内容阅读器上所显示的内容的一部分的速率来提供自动内容滚动。在一个实施例中,HMD可以将显示在虚拟内容阅读器上的内容的自动滚动与用户控制的滚动(例如通过HMD的最终用户的头部跟踪)相组合。
-
-
-
-
-
-
-
-
-