一种基于助教的动态目标对齐的数据高效知识蒸馏方法和系统

    公开(公告)号:CN118194952A

    公开(公告)日:2024-06-14

    申请号:CN202410024764.8

    申请日:2024-01-08

    Abstract: 本发明涉及一种基于助教的动态目标对齐的数据高效知识蒸馏方法和系统。该方法包括:在数据层,采用基于熵的策略选择信息丰富的样本,将其输入学生模型进行学习;在模型层,引入助教模型,根据训练过程中学生模型的能力的演变动态地查询教师模型或助教模型;在目标层,根据熵值从教师模型中选择信息丰富的层,使学生模型与选择的教师模型中信息丰富的层进行动态对齐;通过学生模型、教师模型和助教模型,使知识从教师模型向学生模型转移,并随着学生模型的能力的进化提高知识蒸馏性能。本发明能够从数据、模型和目标层面全面提升知识蒸馏效果。

Patent Agency Ranking