-
公开(公告)号:CN118536514A
公开(公告)日:2024-08-23
申请号:CN202410617153.4
申请日:2024-05-17
Applicant: 厦门大学
IPC: G06F40/35 , G06F16/332 , G06F16/33
Abstract: 本发明提供了自然语言处理技术领域的一种基于BERT和GPT的对话方法及系统,方法包括如下步骤:步骤S1、基于BERT编码器以及GPT解码器创建一初始对话模型;步骤S2、对所述初始对话模型进行生成式预训练;步骤S3、对生成式预训练后的所述初始对话模型进行多任务训练;步骤S4、将多任务训练训练后的所述初始对话模型作为老师模型,将初始的所述初始对话模型作为学生模型,基于所述老师模型对学生模型进行知识蒸馏训练,得到智能对话模型;步骤S5、对所述智能对话模型进行微调训练后,基于所述智能对话模型进行智能对话。本发明的优点在于:在限制模型参数量的前提下极大地提升了对话能力。