-
公开(公告)号:CN109313667B
公开(公告)日:2023-06-06
申请号:CN201780037738.7
申请日:2017-06-12
Applicant: 微软技术许可有限责任公司
Abstract: 提供了用于构建特定于对话状态的多轮上下文语言理解系统的系统和方法。更具体地,这样的系统和方法从形成的单槽语言理解模型和/或单槽规则集推断或被配置为从形成的单槽语言理解模型和/或单槽规则集推断特定于状态的模式和/或特定于状态的规则。由此,系统和方法仅需要来自构建方的、对形成单槽语言理解模型和/或单槽规则集必要的信息,来形成或构建特定于对话状态的多轮上下文语言理解系统。相应地,与需要来自构建方的、比构建单槽语言理解系统所必要的进一步输入的系统和方法相比,用于构建特定于对话状态的多轮上下文语言理解系统的系统和方法减少了构建针对应用的特定于对话状态的多轮上下文语言理解系统必要的专家知识、时间和资源。
-
公开(公告)号:CN108369806B
公开(公告)日:2022-07-22
申请号:CN201780004731.5
申请日:2017-01-14
Applicant: 微软技术许可有限责任公司
Abstract: 本公开的示例描述了配置通用语言理解模型的系统和方法。在各方面中,可以标识并且收集用于各种应用的一个或多个先前配置的模式。通用模式可以使用所收集的模式来生成。所收集的模式可以被编程地映射到通用模式。通用模式可以用来训练一个或多个模型。可以提供界面以允许浏览模型。界面可以包括配置机制,该配置机制提供模型中的一个或多个模型用于选择。所选择的模型可以编程地绑定,使得实现模型所需的信息和指令被编程地配置。绑定的模型然后可以被提供给请求者。
-
公开(公告)号:CN107735804B
公开(公告)日:2021-10-26
申请号:CN201680039897.6
申请日:2016-07-05
Applicant: 微软技术许可有限责任公司
Abstract: 本公开的示例描述了用于不同标记集合的转移学习技术的系统和方法。在各方面中,可以访问服务器设备上的数据集。数据集可以包括标记和与标记相关联的词集。服务器设备可以引起数据集内的标记嵌入。嵌入的标记可以由对应于特定标记的多维向量表示。向量可以用于构建数据集的标记映射。标记映射可以用于训练模型以执行领域适应或转移学习技术。该模型可以用于向语句/查询或训练模型提供结果。
-
公开(公告)号:CN108369581A
公开(公告)日:2018-08-03
申请号:CN201780004868.0
申请日:2017-01-14
Applicant: 微软技术许可有限责任公司
CPC classification number: G06F17/28 , G06F17/279
Abstract: 描述了一种计算机实现的技术,其支持创建用于与应用一起使用的语言理解(LU)组件。该技术允许开发人员从较大的参数集合中选择参数子集。参数子集与要由应用处理的LU场景有关。较大的参数集合与由已有的通用LU模型处理的多个LU场景有关。该技术创建了一种基于参数子集结合通用LU模型的约束LU组件。在运行时,约束LU组件以受所选择的参数子集约束的方式使用通用LU模型来解释输入语言学项目,以提供输出结果。该技术还允许开发人员创建新规则和/或补充模型。
-
公开(公告)号:CN108369806A
公开(公告)日:2018-08-03
申请号:CN201780004731.5
申请日:2017-01-14
Applicant: 微软技术许可有限责任公司
CPC classification number: G06F17/289 , G06F17/2785 , G06F17/30294 , G06N99/005 , G10L15/22
Abstract: 本公开的示例描述了配置通用语言理解模型的系统和方法。在各方面中,可以标识并且收集用于各种应用的一个或多个先前配置的模式。通用模式可以使用所收集的模式来生成。所收集的模式可以被编程地映射到通用模式。通用模式可以用来训练一个或多个模型。可以提供界面以允许浏览模型。界面可以包括配置机制,该配置机制提供模型中的一个或多个模型用于选择。所选择的模型可以编程地绑定,使得实现模型所需的信息和指令被编程地配置。绑定的模型然后可以被提供给请求者。
-
公开(公告)号:CN107735804A
公开(公告)日:2018-02-23
申请号:CN201680039897.6
申请日:2016-07-05
Applicant: 微软技术许可有限责任公司
CPC classification number: G06N99/005
Abstract: 本公开的示例描述了用于不同标记集合的转移学习技术的系统和方法。在各方面中,可以访问服务器设备上的数据集。数据集可以包括标记和与标记相关联的词集。服务器设备可以引起数据集内的标记嵌入。嵌入的标记可以由对应于特定标记的多维向量表示。向量可以用于构建数据集的标记映射。标记映射可以用于训练模型以执行领域适应或转移学习技术。该模型可以用于向语句/查询或训练模型提供结果。
-
公开(公告)号:CN107251060A
公开(公告)日:2017-10-13
申请号:CN201680011089.9
申请日:2016-02-03
Applicant: 微软技术许可有限责任公司
CPC classification number: G10L15/063 , G06F17/2775 , G06F17/30705 , G06N7/005 , G06N99/005 , G10L15/18 , G10L2015/0631
Abstract: 提供了使用未经标记的数据预训练序列标签器的系统和方法,诸如隐藏分层条件随机场模型。附加地,提供用于迁移学习的系统和方法。因而,系统和方法构建比先前利用的未经过未经标记的数据预训练和/或无法进行迁移学习/训练的序列标签器更准确,更可靠和/或更有效的序列标签器。
-
公开(公告)号:CN107251011A
公开(公告)日:2017-10-13
申请号:CN201680010623.4
申请日:2016-02-03
Applicant: 微软技术许可有限责任公司
CPC classification number: G06N99/005 , G06F17/2705 , G06F17/2785 , G06F17/30864 , G06N7/005
Abstract: 用于比如条件随机场模型之类的序列标签器或者训练该序列标签器的系统和方法。更具体地,系统和方法利用用于具体应用的来自众包的数据的部分地标注的数据和来自搜索日志的部分地标注的数据来训练序列标签器。另外,在此公开的系统和方法通过利用受约束格构仅利用部分地标注的数据来训练序列标签器,其中受约束格构内的每个输入值可以具有多个候选标签,该多个候选标签具有置信分数。因而,系统和方法与利用至少一些完全地标注的训练数据而被训练的序列标签器相比,提供更准确的序列加标签系统、更可靠的序列加标签系统和更高效的序列加标签系统。
-
公开(公告)号:CN116663569A
公开(公告)日:2023-08-29
申请号:CN202310606709.5
申请日:2017-06-12
Applicant: 微软技术许可有限责任公司
IPC: G06F40/35 , G06F40/289 , G06F40/40 , G06F40/56
Abstract: 提供了用于构建特定于对话状态的多轮上下文语言理解系统的系统和方法。更具体地,这样的系统和方法从形成的单槽语言理解模型和/或单槽规则集推断或被配置为从形成的单槽语言理解模型和/或单槽规则集推断特定于状态的模式和/或特定于状态的规则。由此,系统和方法仅需要来自构建方的、对形成单槽语言理解模型和/或单槽规则集必要的信息,来形成或构建特定于对话状态的多轮上下文语言理解系统。相应地,与需要来自构建方的、比构建单槽语言理解系统所必要的进一步输入的系统和方法相比,用于构建特定于对话状态的多轮上下文语言理解系统的系统和方法减少了构建针对应用的特定于对话状态的多轮上下文语言理解系统必要的专家知识、时间和资源。
-
公开(公告)号:CN107251011B
公开(公告)日:2021-10-22
申请号:CN201680010623.4
申请日:2016-02-03
Applicant: 微软技术许可有限责任公司
IPC: G06F40/205 , G06F40/30 , G06F16/9532 , G06N20/00 , G06N7/00
Abstract: 用于比如条件随机场模型之类的序列标签器或者训练该序列标签器的系统和方法。更具体地,系统和方法利用用于具体应用的来自众包的数据的部分地标注的数据和来自搜索日志的部分地标注的数据来训练序列标签器。另外,在此公开的系统和方法通过利用受约束格构仅利用部分地标注的数据来训练序列标签器,其中受约束格构内的每个输入值可以具有多个候选标签,该多个候选标签具有置信分数。因而,系统和方法与利用至少一些完全地标注的训练数据而被训练的序列标签器相比,提供更准确的序列加标签系统、更可靠的序列加标签系统和更高效的序列加标签系统。
-
-
-
-
-
-
-
-
-