-
公开(公告)号:CN110431626A
公开(公告)日:2019-11-08
申请号:CN201880015606.9
申请日:2018-02-27
Applicant: 微软技术许可有限责任公司
Inventor: R·古鲁纳特库尔卡尼 , A·M·扈利 , Z·A·阿瓦卜 , N·阿龙 , I·齐图尼
Abstract: 自动语音识别系统可以受益于用户语音中的提示,比如超发声。传统方法通常尝试定义和检测超发声的绝对状态,但这是非常困难的,尤其是对于短语音查询。本公开内容提供了一种使用成对比较和在真实世界语音识别系统上进行超发声检测的方法。所公开的方法使用从一对重复的用户话音中提取的增量特征。由所公开的系统和方法提供的改进包括:通过使用超发声信息作为第二遍N最佳假设重新评分设置中的特征,来改善词错误率。
-
公开(公告)号:CN110945515B
公开(公告)日:2024-04-30
申请号:CN201880048926.4
申请日:2018-05-30
Applicant: 微软技术许可有限责任公司
Abstract: 本文中描述了一种机制,用于适应在已经使用具有第一组特征的第一组用户输入来训练的语言理解模型中使用的机器学习模型,以使用具有第二组特征的用户输入来有效地进行操作。损失是根据第一组特征、第二组特征或第一组和第二组共同的特征定义的。损失包括源侧标记损失、重建损失、对抗域分类损失、非对抗域分类损失、正交损失和目标侧标记损失中的一个或多个。使用梯度下降法将损失联合最小化,并将所得系数用于重新训练机器学习模型。
-
公开(公告)号:CN110383266B
公开(公告)日:2023-08-18
申请号:CN201880016162.0
申请日:2018-02-27
Applicant: 微软技术许可有限责任公司
IPC: G06F16/9535 , G06F40/253 , G06F40/40
Abstract: 公开了使用语义存储器进行个性化通信的系统和方法。在一个实现中,从用户接收第一通信并且对其进行处理以识别通信内的第一内容元素。第一内容元素与内容存储库中的第二内容元素相关联。从用户接收包括第一内容元素的第二通信。基于该第一内容元素和内容存储库中的第二内容元素之间的关联,生成包括第二内容元素的第三通信并且响应于第二通信来将其提供给用户。
-
公开(公告)号:CN110431626B
公开(公告)日:2023-08-25
申请号:CN201880015606.9
申请日:2018-02-27
Applicant: 微软技术许可有限责任公司
Inventor: R·古鲁纳特库尔卡尼 , A·M·扈利 , Z·A·阿瓦卜 , N·阿龙 , I·齐图尼
Abstract: 自动语音识别系统可以受益于用户语音中的提示,比如超发声。传统方法通常尝试定义和检测超发声的绝对状态,但这是非常困难的,尤其是对于短语音查询。本公开内容提供了一种使用成对比较和在真实世界语音识别系统上进行超发声检测的方法。所公开的方法使用从一对重复的用户话音中提取的增量特征。由所公开的系统和方法提供的改进包括:通过使用超发声信息作为第二遍N最佳假设重新评分设置中的特征,来改善词错误率。
-
公开(公告)号:CN110998567A
公开(公告)日:2020-04-10
申请号:CN201880050580.1
申请日:2018-05-30
Applicant: 微软技术许可有限责任公司
IPC: G06F16/953 , G06F16/901 , G06N3/00
Abstract: 在本文中描述的是一种可以在诸如个人数字助理的系统中使用的对话引擎或者将在请求执行期间所构建的动态知识图谱与保存长期知识的一个或多个静态知识图谱相结合的搜索引擎。该对话引擎包括保存表示对话的当前状态的动态知识图谱的状态跟踪器,选择该动态知识图谱中的实体并且执行那些实体中所提供的动作以将对话状态朝向完成移动的策略引擎,以及用于搜索所述静态知识图谱的知识图谱搜索引擎。通过多个轮次地构建动态知识图谱并且将朝向对话完成构建的操作链接在一起来完成该对话。该对话的完成引起用户所进行的请求的完成。
-
公开(公告)号:CN113168305B
公开(公告)日:2024-01-09
申请号:CN201980079952.8
申请日:2019-11-28
Applicant: 微软技术许可有限责任公司
IPC: G06F3/16
Abstract: 在本文中描述了一种计算机实现的技术,其用于加快用户与数字助理的交互。在一个实现方式中,所述技术涉及响应于由用户经由输入设备提供的输入命令来接收由数字助理生成的系统提示。然后,所述技术基于所述系统提示的语言内容连同与在其中发出系统提示的环境有关的上下文特征来生成预测的响应。所述预测的响应对应于用户将如何响应所述系统提示的预测。然后,所述技术基于与所述预测的响应相关联的置信度值,从多个对话动作中选择一个或多个对话动作。所述技术通过减少要求用户响应的系统提示的数量来加快用户与数字助理的交互。
-
公开(公告)号:CN110945513B
公开(公告)日:2024-01-09
申请号:CN201880047864.5
申请日:2018-05-30
Applicant: 微软技术许可有限责任公司
Abstract: 提供了用于将新领域添加到自然语言理解系统以形成具有多个领域专家的经更新的语言理解系统的系统和方法。更具体而言,所述系统和方法能够利用来自在自然语言理解系统上已经存在的领域中的一个或多个领域的数据来添加新领域,同时保持新领域与已经存在的领域彼此分离。
-
公开(公告)号:CN110998567B
公开(公告)日:2023-10-27
申请号:CN201880050580.1
申请日:2018-05-30
Applicant: 微软技术许可有限责任公司
IPC: G06F16/332 , G06F16/901 , G06N5/02
Abstract: 在本文中描述的是一种可以在诸如个人数字助理的系统中使用的对话引擎或者将在请求执行期间所构建的动态知识图谱与保存长期知识的一个或多个静态知识图谱相结合的搜索引擎。该对话引擎包括保存表示对话的当前状态的动态知识图谱的状态跟踪器,选择该动态知识图谱中的实体并且执行那些实体中所提供的动作以将对话状态朝向完成移动的策略引擎,以及用于搜索所述静态知识图谱的知识图谱搜索引擎。通过多个轮次地构建动态知识图谱并且将朝向对话完成构建的操作链接在一起来完成该对话。该对话的完成引起用户所进行的请求的完成。
-
公开(公告)号:CN113168305A
公开(公告)日:2021-07-23
申请号:CN201980079952.8
申请日:2019-11-28
Applicant: 微软技术许可有限责任公司
IPC: G06F3/16
Abstract: 在本文中描述了一种计算机实现的技术,其用于加快用户与数字助理的交互。在一个实现方式中,所述技术涉及响应于由用户经由输入设备提供的输入命令来接收由数字助理生成的系统提示。然后,所述技术基于所述系统提示的语言内容连同与在其中发出系统提示的环境有关的上下文特征来生成预测的响应。所述预测的响应对应于用户将如何响应所述系统提示的预测。然后,所述技术基于与所述预测的响应相关联的置信度值,从多个对话动作中选择一个或多个对话动作。所述技术通过减少要求用户响应的系统提示的数量来加快用户与数字助理的交互。
-
公开(公告)号:CN110945515A
公开(公告)日:2020-03-31
申请号:CN201880048926.4
申请日:2018-05-30
Applicant: 微软技术许可有限责任公司
Abstract: 本文中描述了一种机制,用于适应在已经使用具有第一组特征的第一组用户输入来训练的语言理解模型中使用的机器学习模型,以使用具有第二组特征的用户输入来有效地进行操作。损失是根据第一组特征、第二组特征或第一组和第二组共同的特征定义的。损失包括源侧标记损失、重建损失、对抗域分类损失、非对抗域分类损失、正交损失和目标侧标记损失中的一个或多个。使用梯度下降法将损失联合最小化,并将所得系数用于重新训练机器学习模型。
-
-
-
-
-
-
-
-
-