-
公开(公告)号:CN118761439A
公开(公告)日:2024-10-11
申请号:CN202410679289.8
申请日:2024-05-29
Applicant: 湖南大学
IPC: G06N3/042 , G06N3/082 , G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种基于知识蒸馏的网络结构构建方法及装置,涉及网络结构构建技术领域。本发明至少包括以下步骤:步骤一:设计一个基于Token选择的视觉transformer模型;步骤二:设计并训练一个Token选择网络;步骤三:设计一个Token选择的视觉transformer模型名为TS‑ViT;步骤四:设计损失函数TS‑ViT的损失函数;步骤五:在特定数据集上进行图像分类训练与测试,通过与Token选择网络配合使用的优化后模型进行,以减少计算量并保持或提升图像分类精度。本发明为了解决token裁剪策略不具有泛化的特性限制并扩展适用场景,进而基于知识蒸馏的Token选择网络,该网络非常轻量,且不依赖于任何的网络模型结构,训练后即插即用,以较小的精度损失大量减少计算量。