-
公开(公告)号:CN102460423B
公开(公告)日:2015-09-09
申请号:CN201080025833.3
申请日:2010-06-01
Applicant: 微软技术许可有限责任公司
CPC classification number: G06N99/005 , G10L15/08 , G10L15/19 , G10L15/32 , G10L2015/228
Abstract: 描述了采用总体语法作为用于识别输入的一组环境专用语法的体系结构,每个环境专用语法负责一个特定的环境,诸如子任务类别、地理区域等等。这些语法一起覆盖了整个域。此外,对于同一个输入可以并行地运行多个识别,其中每个识别使用环境专用语法中的一个或多个。通过使用基于多个识别结果以及可能其它域知识的动态合成语法、或者使用对从多个识别结果及其他域知识提取的分类特征进行操作的统计分类器来选择获胜者,来自不同识别器语法的多个中间识别结果得以被协调。
-
公开(公告)号:CN106133826A
公开(公告)日:2016-11-16
申请号:CN201580016605.2
申请日:2015-03-23
Applicant: 微软技术许可有限责任公司
IPC: G10L15/183 , G10L15/30 , G06F17/27
Abstract: 提供了对用于语音识别的语言模型组件的自定义。可以使得语言模式组件的列表可以由计算设备使用。接着,将用于对来自列表的多个语言模型组件进行组合的提示发送至识别服务提供者。该提示可以基于多个不同的领域。接着,可以从识别服务提供者处接收基于该提示的语言模型组件的自定义的组合。
-
公开(公告)号:CN118749117A
公开(公告)日:2024-10-08
申请号:CN202280092556.0
申请日:2022-12-29
Applicant: 微软技术许可有限责任公司
IPC: G10L15/183
Abstract: 本文一般所讨论的是针对多语言模型生成的设备、系统和方法。一种方法可以包括针对低资源语言,确定指示低资源语言中的每个低资源语言之间的语言相似性的相应的语言相似性值,基于相应的语言相似性值将低资源语言聚类到组中,聚合与给定组相对应的语言的训练数据得到经聚合的训练数据,以及基于经聚合的训练数据来训练重排序语言模型得到经训练的重排序语言模型。
-
公开(公告)号:CN115605947A
公开(公告)日:2023-01-13
申请号:CN202180032695.X
申请日:2021-04-30
Applicant: 微软技术许可有限责任公司(US)
Abstract: 提供了用于在多个分布式计算设备处保护对机器学习训练数据的数据访问的实施例。包括与优选的数据安全性等级相对应的原始数据的电子内容被划分成多个微分段。多个微分段被限制性地分发到多个计算设备,该多个计算设备将转录标签应用于多个微分段。带标签的微分段被重构成训练数据,该训练数据随后被用于训练机器学习模型,同时促进来自经重构的微分段的训练数据所包括的原始数据的数据安全性的提高。
-
公开(公告)号:CN106133826B
公开(公告)日:2019-12-17
申请号:CN201580016605.2
申请日:2015-03-23
Applicant: 微软技术许可有限责任公司
IPC: G10L15/183 , G10L15/30 , G06F17/27
Abstract: 提供了对用于语音识别的语言模型组件的自定义。可以使得语言模式组件的列表可以由计算设备使用。接着,将用于对来自列表的多个语言模型组件进行组合的提示发送至识别服务提供者。该提示可以基于多个不同的领域。接着,可以从识别服务提供者处接收基于该提示的语言模型组件的自定义的组合。
-
-
-
-