-
公开(公告)号:CN106922185A
公开(公告)日:2017-07-04
申请号:CN201580052576.5
申请日:2015-09-28
Applicant: 微软技术许可有限责任公司
CPC classification number: G06F3/011 , G06F1/163 , G06F3/014 , G06F3/017 , G06F3/0346 , H04M1/7253 , H04M2250/12 , G06F3/01
Abstract: “自然运动控制器”标识用户的身体的一个或多个部分的各种运动以与电子设备交互,由此实现各种自然用户接口(NUI)场景。自然运动控制器通过连结从多个分离的惯性传感器集接收到的惯性传感器数据的可调整数目的顺序时段来构建复合运动识别窗口。这些分离的惯性传感器集中的每个惯性传感器集被耦合到分离的用户穿戴、携带或者手持的移动计算设备,或者提供与分离的用户穿戴、携带或者手持的移动计算设备有关的传感器数据。每个复合运动识别窗口然后被传递到由一个或多个基于机器的深度学习过程训练的运动识别模型。该运动识别模型然后被应用到复合运动识别窗口以标识一个或多个预定义运动的序列。所标识的运动然后被用作触发一个或多个应用命令的执行的基础。
-
公开(公告)号:CN105122279A
公开(公告)日:2015-12-02
申请号:CN201480012430.3
申请日:2014-03-04
Applicant: 微软技术许可有限责任公司
CPC classification number: G10L15/16 , G06N3/0481 , G06N3/084 , G10L15/07 , G10L15/20
Abstract: 本文描述的各种技术涉及针对特定用户或上下文来保守地适配识别系统中的深度神经网络(DNN)。DNN被用来响应于对所捕捉的用户输入的接收来输出上下文相关单元的各模型上的概率分布。基于所捕捉的用户输入来针对特定用户适配所述DNN,其中所述适配是保守地进行的,以使得已适配的DNN和未适配的DNN的输出之间的偏差受到约束。
-
公开(公告)号:CN107077841B
公开(公告)日:2020-10-16
申请号:CN201580031571.4
申请日:2015-06-12
Applicant: 微软技术许可有限责任公司
Abstract: 本技术与利用循环神经网络(RNN)来将文本转换为语音相关。循环神经网络可以被实现为用于确定文本的特性的多个模块。在实施例中,可以利用词性RNN模块、发音RNN模块、语言注音标记RNN模块、以及上下文感知和语义挖掘RNN模块全部。来自RNN模块的特性是通过基于其他RNN模块的输出来确定输入文本的拼音特性的超结构RNN模块来处理。超结构RNN模块可以生成能够由语音合成器转换为可听见的语音的生成序列。生成序列还可以通过全局优化模块在被合成为可听见的语音之前进行优化。
-
公开(公告)号:CN105122279B
公开(公告)日:2018-09-18
申请号:CN201480012430.3
申请日:2014-03-04
Applicant: 微软技术许可有限责任公司
Abstract: 本文描述的各种技术涉及针对特定用户或上下文来保守地适配识别系统中的深度神经网络(DNN)。DNN被用来响应于对所捕捉的用户输入的接收来输出上下文相关单元的各模型上的概率分布。基于所捕捉的用户输入来针对特定用户适配所述DNN,其中所述适配是保守地进行的,以使得已适配的DNN和未适配的DNN的输出之间的偏差受到约束。
-
公开(公告)号:CN107077638A
公开(公告)日:2017-08-18
申请号:CN201580031721.1
申请日:2015-06-10
Applicant: 微软技术许可有限责任公司
Abstract: 本技术涉及利用递归神经网络(RNN)执行字母到声音的转换。RNN可以实现为用于进行字母到声音的转换的RNN模块。RNN模块接收文本输入,并将文本转换为对应的音素。在确定对应的音素时,RNN模块可以分析文本的字母和在被分析字母周围的字母。RNN模块还可以以相反次序分析文本的字母。RNN模块还可以接收关于输入文本的上下文信息。字母到声音转换于是还可以基于接收到的上下文信息。确定出的音素可以用于根据输入文本生成合成语音。
-
公开(公告)号:CN107077841A
公开(公告)日:2017-08-18
申请号:CN201580031571.4
申请日:2015-06-12
Applicant: 微软技术许可有限责任公司
Abstract: 本技术与利用循环神经网络(RNN)来将文本转换为语音相关。循环神经网络可以被实现为用于确定文本的特性的多个模块。在实施例中,可以利用词性RNN模块、发音RNN模块、语言注音标记RNN模块、以及上下文感知和语义挖掘RNN模块全部。来自RNN模块的特性是通过基于其他RNN模块的输出来确定输入文本的拼音特性的超结构RNN模块来处理。超结构RNN模块可以生成能够由语音合成器转换为可听见的语音的生成序列。生成序列还可以通过全局优化模块在被合成为可听见的语音之前进行优化。
-
-
-
-
-