-
公开(公告)号:CN106463119B
公开(公告)日:2020-07-10
申请号:CN201580029986.8
申请日:2015-06-03
Applicant: 微软技术许可有限责任公司
IPC: G10L15/24
Abstract: 本文中描述的技术涉及修改用于在显示器上呈现的视觉内容以支持改进自动语音识别(ASR)系统的性能。视觉内容被修改以将元素移动为进一步远离彼此,其中被移动的元素引起来自ASR系统的角度的歧义。视觉内容被修改以考虑凝视跟踪的准确性。当用户查看所修改的视觉内容中的元素时,ASR系统根据正被用户查看的元素来被定制。
-
公开(公告)号:CN106922185A
公开(公告)日:2017-07-04
申请号:CN201580052576.5
申请日:2015-09-28
Applicant: 微软技术许可有限责任公司
CPC classification number: G06F3/011 , G06F1/163 , G06F3/014 , G06F3/017 , G06F3/0346 , H04M1/7253 , H04M2250/12 , G06F3/01
Abstract: “自然运动控制器”标识用户的身体的一个或多个部分的各种运动以与电子设备交互,由此实现各种自然用户接口(NUI)场景。自然运动控制器通过连结从多个分离的惯性传感器集接收到的惯性传感器数据的可调整数目的顺序时段来构建复合运动识别窗口。这些分离的惯性传感器集中的每个惯性传感器集被耦合到分离的用户穿戴、携带或者手持的移动计算设备,或者提供与分离的用户穿戴、携带或者手持的移动计算设备有关的传感器数据。每个复合运动识别窗口然后被传递到由一个或多个基于机器的深度学习过程训练的运动识别模型。该运动识别模型然后被应用到复合运动识别窗口以标识一个或多个预定义运动的序列。所标识的运动然后被用作触发一个或多个应用命令的执行的基础。
-
公开(公告)号:CN106663426A
公开(公告)日:2017-05-10
申请号:CN201580036274.9
申请日:2015-07-02
Applicant: 微软技术许可有限责任公司
Inventor: J·威廉姆斯 , G·茨威格 , A·拉克什米拉坦 , C·G·J·苏亚雷斯
CPC classification number: G06F3/167 , G06F17/279 , G06F17/30654 , G10L15/1822 , G10L15/22 , G10L2015/223 , G10L2015/226
Abstract: 人和计算机系统之间的会话交互可以由计算机系统提供,该计算机系统按照会话类型将输入分类,并且为会话类型提供人类创作的响应。输入分类可以使用经训练的二元分类器而被执行。训练可以通过将输入标记为会话类型的肯定示例或否定示例而被执行。会话响应可以由标记在训练分类器时使用的输入的相同个体创作。在一些情况下,训练分类器的过程可以导致新的会话类型的提出,人类作者可以针对该新的会话类型为新分类器标记输入以及为用于该新的会话类型的响应编写内容。
-
公开(公告)号:CN109074514B
公开(公告)日:2022-04-15
申请号:CN201780028527.7
申请日:2017-05-06
Applicant: 微软技术许可有限责任公司
IPC: G06N3/04
Abstract: 实施例包括用于使用、创建和维护面向目标的对话系统(即,事务机器人)的方法和系统,其提供到应用功能性的接口。实施例的方法和系统提供了一种机器人,该机器人可以从领域专家所提供的会话示例和与用户的交互中学习监督学习和强化学习。可以创建会话机器人以使用文本和/或应用编程接口(API)调用进行交互。开发者可以配置与应用后端进行接口的机器人,其中可以通过使用屏蔽动作来控制机器人的行为。可以灵活地设计用于机器人的规范以指定如何组织开发者代码,例如,作为对机器人可以执行的可能动作的屏蔽操作。另外,方法和系统可以在对话期间自动推断最佳状态表示,因此不需要预定义状态变量。
-
公开(公告)号:CN109074514A
公开(公告)日:2018-12-21
申请号:CN201780028527.7
申请日:2017-05-06
Applicant: 微软技术许可有限责任公司
IPC: G06N3/04
Abstract: 实施例包括用于使用、创建和维护面向目标的对话系统(即,事务机器人)的方法和系统,其提供到应用功能性的接口。实施例的方法和系统提供了一种机器人,该机器人可以从领域专家所提供的会话示例和与用户的交互中学习监督学习和强化学习。可以创建会话机器人以使用文本和/或应用编程接口(API)调用进行交互。开发者可以配置与应用后端进行接口的机器人,其中可以通过使用屏蔽动作来控制机器人的行为。可以灵活地设计用于机器人的规范以指定如何组织开发者代码,例如,作为对机器人可以执行的可能动作的屏蔽操作。另外,方法和系统可以在对话期间自动推断最佳状态表示,因此不需要预定义状态变量。
-
公开(公告)号:CN107077638A
公开(公告)日:2017-08-18
申请号:CN201580031721.1
申请日:2015-06-10
Applicant: 微软技术许可有限责任公司
Abstract: 本技术涉及利用递归神经网络(RNN)执行字母到声音的转换。RNN可以实现为用于进行字母到声音的转换的RNN模块。RNN模块接收文本输入,并将文本转换为对应的音素。在确定对应的音素时,RNN模块可以分析文本的字母和在被分析字母周围的字母。RNN模块还可以以相反次序分析文本的字母。RNN模块还可以接收关于输入文本的上下文信息。字母到声音转换于是还可以基于接收到的上下文信息。确定出的音素可以用于根据输入文本生成合成语音。
-
公开(公告)号:CN106463119A
公开(公告)日:2017-02-22
申请号:CN201580029986.8
申请日:2015-06-03
Applicant: 微软技术许可有限责任公司
IPC: G10L15/24
Abstract: 本文中描述的技术涉及修改用于在显示器上呈现的视觉内容以支持改进自动语音识别(ASR)系统的性能。视觉内容被修改以将元素移动为进一步远离彼此,其中被移动的元素引起来自ASR系统的角度的歧义。视觉内容被修改以考虑凝视跟踪的准确性。当用户查看所修改的视觉内容中的元素时,ASR系统根据正被用户查看的元素来被定制。
-
-
-
-
-
-