-
公开(公告)号:CN112084295B
公开(公告)日:2024-12-10
申请号:CN201910447514.4
申请日:2019-05-27
Applicant: 微软技术许可有限责任公司
IPC: G06F16/33 , G06F16/332 , G06F40/30 , G06N3/084
Abstract: 在本公开的实施例中,提出了一种跨语言的任务训练方法。在获得一种语言的训练句子之后,对训练句子中的某个词语进行掩码,然后获得与被掩码的词语相对应的另一种语言的对应词语。接下来,使用一种语言的掩码句子和另一种语言的对应词语来预训练跨语言模型。经过预训练的跨语言模型具备多语言的理解和处理能力,其可以根据特定任务再进行进一步训练。根据本公开的实施例,在一种语言存在大量训练语料而另一种语言存在较少甚至没有训练语料的情况下,可以通过跨语言训练方式来预训练跨语言模型,使得跨语言模型能够适用于另一种语言,由此实现针对各种语言的模型训练。
-
公开(公告)号:CN110019471B
公开(公告)日:2024-03-08
申请号:CN201711348978.7
申请日:2017-12-15
Applicant: 微软技术许可有限责任公司
IPC: G06F16/25 , G06F40/157
-
公开(公告)号:CN115481013A
公开(公告)日:2022-12-16
申请号:CN202110666857.7
申请日:2021-06-16
Applicant: 微软技术许可有限责任公司
Abstract: 根据本公开的实现,提供了代码错误检测的方案。根据该方案,确定源代码对应的语法结构,语法结构包括以层级结构相连的多个节点,多个节点分别指示源代码中的多个片段,每个片段包括源代码中的多个代码单元中的至少一个代码单元。提取多个代码单元对应的多个单元特征表示。基于多个单元特征表示和语法结构,确定语法结构中的多个节点对应的多个片段特征表示,每个节点对应的片段特征表示至少基于该节点指示的片段所包括的至少一个代码单元对应的单元特征表示来确定。基于多个片段特征表示来确定错误信息,该错误信息指示源代码中是否存在错误。由此,可以自动、高效、准确地检测代码错误。
-
公开(公告)号:CN110019719A
公开(公告)日:2019-07-16
申请号:CN201711354191.1
申请日:2017-12-15
Applicant: 微软技术许可有限责任公司
IPC: G06F16/332
Abstract: 在本文所描述的主题的实施例中,提出了一种基于断言的问答方式。在获得问题以及相关文章之后,根据文章的内容来确定针对该问题的断言回答,其中断言回答具有预定结构并且表示完整的语义。然后,可以向用户输出针对该问题的断言回答。在根据本文所描述的主题的实施例中,使用问题和相关文章作为输入,并且输出半结构化的断言回答。根据本文所描述的主题的实施例的断言回答能够提供比传统的短回答更丰富的语义内容,并且提供比传统的长回答更简洁的表达,由此提升了用户体验同时保证了回答的准确性。
-
公开(公告)号:CN116438529A
公开(公告)日:2023-07-14
申请号:CN202080107084.2
申请日:2020-11-12
Applicant: 微软技术许可有限责任公司
IPC: G06F16/9032
Abstract: 一种用于生成式常识推理的知识注入模型。在示例中,使用编码器‑解码器模型来生成模型输出(204),针对概念集的合理描述。从领域内或领域外知识语料库生成原型(218),该原型进一步被用作针对编码器‑解码器模型的输入(202)。缩放概念输入令牌和原型输入令牌,以限制可能由原型(218)引入的潜在偏差。另外,针对每个输入令牌生成位置指示符,这些位置指示符指示每个输入令牌与其他输入令牌相比的相对位置。如此,在对经缩放的、经编码的输入令牌进行解码时,解码器(214)可以更适应由原型(218)在生成模型输出(204)时引入的场景偏差。因此,在生成模型输出(204)时,编码器‑解码器模型不需要仅仅依赖于概念集。
-
公开(公告)号:CN115220875A
公开(公告)日:2022-10-21
申请号:CN202110404714.9
申请日:2021-04-15
Applicant: 微软技术许可有限责任公司
Abstract: 本公开提出了用于执行多个任务的方法和装置。可以获得文本输入。可以生成所述文本输入的在多个层中的一组共享表示。可以基于所述一组共享表示来生成所述文本输入的多个任务特定表示。可以利用所述多个任务特定表示来分别执行所述多个任务。
-
公开(公告)号:CN111159472A
公开(公告)日:2020-05-15
申请号:CN201811327202.1
申请日:2018-11-08
Applicant: 微软技术许可有限责任公司
IPC: G06F16/735 , G06F16/783
Abstract: 本文公开的多模态聊天技术,用于在聊天机器人与人类的交互中,采用多模态答复的方式对用户询问进行答复。通过采用多模态方式的答复,使得聊天机器人的表达方式和内容更加丰富。
-
公开(公告)号:CN110888966B
公开(公告)日:2024-05-10
申请号:CN201811038457.6
申请日:2018-09-06
Applicant: 微软技术许可有限责任公司
IPC: G06F16/332 , G06F16/36
Abstract: 根据本公开的实现,提出了一种用于回答自然语言对话中的问题的方案。在该方案中,自然语言对话中的问题被接收。问题被转换成表示其语义的逻辑表示。该逻辑表示包括在知识库上可执行的第一动作序列。通过在知识库上执行第一动作序列来获得针对该问题的回答。该方案能够准确地理解多轮对话中的问题的语义,从而能够将问题转换成在大规模知识库上可执行的动作序列。以此方式,该方案能够有效提高自然语言问题系统回答问题的准确度和效率。
-
公开(公告)号:CN111428508A
公开(公告)日:2020-07-17
申请号:CN201811585240.7
申请日:2018-12-24
Applicant: 微软技术许可有限责任公司
IPC: G06F40/30
Abstract: 本公开的实施例涉及风格可定制的文本生成。在一种方法中,接收第一自然语言文本;通过文本生成模型将第一自然语言文本转换为第二自然语言文本,第二自然语言文本至少部分地体现第一自然语言文本的含义并且具有与第一自然语言文本可区分的风格,文本生成模型包括可修改的参数;以及响应于接收到针对参数的修改,通过文本生成模型将第一自然语言文本转换为第三自然语言文本,第三语言文本至少部分地体现第一自然语言文本的含义并且具有与第一自然语言文本和第二语言文本均可区分的风格。
-
公开(公告)号:CN116635874B
公开(公告)日:2025-04-04
申请号:CN202080107781.8
申请日:2020-12-25
Applicant: 微软技术许可有限责任公司
Abstract: 提供了用于基于训练数据训练数据模型的系统和方法。该训练包括基于自回归(AR)模型和非自回归(NAR)模型的组合预训练和微调数据模型。训练数据可以被并被编码为词元流。解码期间的预训练器生成AR和NAR组合的模型的连续数据结构的连续统一体,AR和NAR组合的模型包括主流和一系列预测流。预测流中的掩码词元参考或注意主流或先前预测流中的一个或多个先前词元。微调器根据目标数据模型选择流来生成经训练的模型。目标数据模型基于平衡用于预测词元的准确性约束和效率约束被确定。解码器在生成经训练的数据模型中充当AR和NAR模型之间的桥梁。
-
-
-
-
-
-
-
-
-