Patent search ap:("中国科学院自动化研究所") AND inv:"亢晓勉" Page 2

11.

发明公开
多语言对话状态追踪模型的训练方法及装置有权

公开(公告)号：CN117149987A

公开(公告)日：2023-12-01

申请号：CN202311426764.2

申请日：2023-10-31

Applicant: 中国科学院自动化研究所

Inventor： 向露 , 亢晓勉 , 张亚萍 , 周玉 , 宗成庆

IPC: G06F16/332 , G06F18/22 , G06F18/214 , G06F40/35 , G06F40/211 , G06F40/242

Abstract: 本发明属于自然语言处理技术领域，提供了一种多语言对话状态追踪模型的训练方法及装置，该多语言对话状态追踪模型的训练方法包括：获取源语言数据；基于多语词典对多个对话上下文信息进行语码转换，得到语码转换对话上下文信息；以语码转换对话上下文信息为训练样本，以第一函数为训练损失函数，对多语言训练模型进行多任务联合训练，得到多语言对话状态追踪模型。本发明所述方法通过设计多种微调任务，能够构建有效的多语言生成式对话状态追踪模型，使得模型具备对不同语言对话上下文的理解能力，提高了多语言对话状态追踪性能。

Patent Agency Ranking