发明公开
- 专利标题: 用于代码切换语义解析的系统和方法
-
申请号: CN202280093261.5申请日: 2022-04-26
-
公开(公告)号: CN118749104A公开(公告)日: 2024-10-08
- 发明人: 拉胡尔·戈埃尔 , 希亚姆·乌帕德亚伊 , 安莫尔·阿加瓦尔
- 申请人: 谷歌有限责任公司
- 申请人地址: 美国
- 专利权人: 谷歌有限责任公司
- 当前专利权人: 谷歌有限责任公司
- 当前专利权人地址: 美国
- 代理机构: 中原信达知识产权代理有限责任公司
- 代理商 邓聪惠; 李宝泉
- 优先权: 202241013023 20220310 IN
- 国际申请: PCT/US2022/026338 2022.04.26
- 国际公布: WO2023/172275 EN 2023.09.14
- 进入国家日期: 2024-09-06
- 主分类号: G06F40/205
- IPC分类号: G06F40/205 ; G06F40/295 ; G06F40/45
摘要:
用于生成代码切换语义解析训练数据以及训练语义解析器的系统和方法。在一些示例中,处理系统(102)可以被配置为使用经训练的第一语言模型(308b)来将第一单一语言文本序列和第一解析数据(302)翻译为第二代码切换文本序列和相关联的第二解析数据(310),并且基于该第二代码切换文本序列和该第二解析数据来生成第二训练示例(314)。在一些示例中,处理系统(102)可以进一步配置为从这些第二训练示例中的两个或更多个第二训练示例生成训练集(314),并且使用该训练集来训练语义解析器(316a)以对代码切换话语进行语义解析。