一种基于知识蒸馏的网络结构构建方法及装置

    公开(公告)号:CN118761439A

    公开(公告)日:2024-10-11

    申请号:CN202410679289.8

    申请日:2024-05-29

    Applicant: 湖南大学

    Abstract: 本发明公开了一种基于知识蒸馏的网络结构构建方法及装置,涉及网络结构构建技术领域。本发明至少包括以下步骤:步骤一:设计一个基于Token选择的视觉transformer模型;步骤二:设计并训练一个Token选择网络;步骤三:设计一个Token选择的视觉transformer模型名为TS‑ViT;步骤四:设计损失函数TS‑ViT的损失函数;步骤五:在特定数据集上进行图像分类训练与测试,通过与Token选择网络配合使用的优化后模型进行,以减少计算量并保持或提升图像分类精度。本发明为了解决token裁剪策略不具有泛化的特性限制并扩展适用场景,进而基于知识蒸馏的Token选择网络,该网络非常轻量,且不依赖于任何的网络模型结构,训练后即插即用,以较小的精度损失大量减少计算量。

Patent Agency Ranking