-
公开(公告)号:CN107077201B
公开(公告)日:2020-06-23
申请号:CN201580050763.X
申请日:2015-09-25
Applicant: 微软技术许可有限责任公司
Inventor: A·普罗科菲瓦 , F·A·塞利基尔马兹 , D·Z·哈卡尼-图尔 , L·赫科 , M·斯拉尼
IPC: G06F3/01
Abstract: 描述了改进对与计算机化会话系统相关联的视觉上下文中的视觉元素的引用的理解和/或解析的准确性。本文描述的技术利用注视输入与姿势和/或语音输入来改进计算机化会话系统中的口头语言理解。通过改进系统能够关于视觉上下文中的视觉元素来解析引用(或解释用户的意图)的准确性,利用注视输入和语音输入改善了会话系统中的口头语言理解。在至少一个示例中,本文中的技术描述了跟踪注视以生成注视输入,标识语音输入以及从该用户输入提取注视特征和词汇特征。至少部分地基于该注视特征和该词汇特征,可以解析被指向视觉上下文中的视觉元素的用户话语。
-
公开(公告)号:CN108369580B
公开(公告)日:2021-11-26
申请号:CN201680071950.0
申请日:2016-11-25
Applicant: 微软技术许可有限责任公司
Inventor: F·A·塞利基尔马兹 , Z·费佐拉希 , D·哈卡尼-图尔 , R·萨里卡亚
IPC: G06F16/2452 , G06F40/30
Abstract: 提供了一种针对项目消歧和选择的基于通用模型的方法。可以由计算设备响应于用于选择的项目的列表来接收话语。在一些方面,项目的列表可以在显示器屏幕上显示。继而可以向话语应用通用消歧模型。通用消歧模型可以用于基于所标识的语言和/或域独立参考特征,来确定话语是否指向项目的列表中的至少一个,并且标识来自列表的与话语相对应的项目。计算设备继而可以执行可以包括选择与话语相关联的所标识的项目的动作。
-
公开(公告)号:CN108369580A
公开(公告)日:2018-08-03
申请号:CN201680071950.0
申请日:2016-11-25
Applicant: 微软技术许可有限责任公司
Inventor: F·A·塞利基尔马兹 , Z·费佐拉希 , D·哈卡尼-图尔 , R·萨里卡亚
CPC classification number: G10L17/22 , G06F17/2785 , G06F17/3043 , G10L17/04 , G10L17/26
Abstract: 提供了一种针对项目消歧和选择的基于通用模型的方法。可以由计算设备响应于用于选择的项目的列表来接收话语。在一些方面,项目的列表可以在显示器屏幕上显示。继而可以向话语应用通用消歧模型。通用消歧模型可以用于基于所标识的语言和/或域独立参考特征,来确定话语是否指向项目的列表中的至少一个,并且标识来自列表的与话语相对应的项目。计算设备继而可以执行可以包括选择与话语相关联的所标识的项目的动作。
-
公开(公告)号:CN107077201A
公开(公告)日:2017-08-18
申请号:CN201580050763.X
申请日:2015-09-25
Applicant: 微软技术许可有限责任公司
Inventor: A·普罗科菲瓦 , F·A·塞利基尔马兹 , D·Z·哈卡尼-图尔 , L·赫科 , M·斯拉尼
IPC: G06F3/01
Abstract: 描述了改进对与计算机化会话系统相关联的视觉上下文中的视觉元素的引用的理解和/或解析的准确性。本文描述的技术利用注视输入与姿势和/或语音输入来改进计算机化会话系统中的口头语言理解。通过改进系统能够关于视觉上下文中的视觉元素来解析引用(或解释用户的意图)的准确性,利用注视输入和语音输入改善了会话系统中的口头语言理解。在至少一个示例中,本文中的技术描述了跟踪注视以生成注视输入,标识语音输入以及从该用户输入提取注视特征和词汇特征。至少部分地基于该注视特征和该词汇特征,可以解析被指向视觉上下文中的视觉元素的用户话语。
-
-
-