一种基于多教师多模态模型的知识蒸馏方法及系统

    公开(公告)号:CN117669693A

    公开(公告)日:2024-03-08

    申请号:CN202311422140.3

    申请日:2023-10-30

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于多教师多模态模型的知识蒸馏方法及系统,属于自然语言处理领域,本发明通过多个教师模型联合进行多模态知识蒸馏到学生模型,这些教师模型具有不同的架构、初始化、训练数据或任务,这种多样性有助于提取不同角度和类型的知识,从而提高了学生模型的鲁棒性以及对图像、文本和图文多模态的理解能力,提升图像识别的准确性、文本理解的准确性和多模态检索的召回率和准确性。

Patent Agency Ranking