-
公开(公告)号:CN118749104A
公开(公告)日:2024-10-08
申请号:CN202280093261.5
申请日:2022-04-26
申请人: 谷歌有限责任公司
IPC分类号: G06F40/205 , G06F40/295 , G06F40/45
摘要: 用于生成代码切换语义解析训练数据以及训练语义解析器的系统和方法。在一些示例中,处理系统(102)可以被配置为使用经训练的第一语言模型(308b)来将第一单一语言文本序列和第一解析数据(302)翻译为第二代码切换文本序列和相关联的第二解析数据(310),并且基于该第二代码切换文本序列和该第二解析数据来生成第二训练示例(314)。在一些示例中,处理系统(102)可以进一步配置为从这些第二训练示例中的两个或更多个第二训练示例生成训练集(314),并且使用该训练集来训练语义解析器(316a)以对代码切换话语进行语义解析。