-
公开(公告)号:CN119475331A
公开(公告)日:2025-02-18
申请号:CN202411415976.5
申请日:2024-10-11
Applicant: 浙江大学
IPC: G06F21/56 , G06F18/214 , G06F18/2431 , G06F18/27 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种无辅助数据依赖的鲁棒后门防御方法和系统,属于深度学习模型安全和人工智能防御技术领域。本发明通过对抗扰动分析后门注入与样本污染之间的内在关系,从有毒数据集中初步隔离干净样本和污染样本;在选定的干净样本上进行反向学习和重新学习,训练得到增强中毒模型;通过增强中毒模型精确识别污染样本和干净样本,并基于干净样本进行模型训练,最终获得无后门的鲁棒模型,最后对污染样本重新标注并用于无后门的鲁棒模型的微调,进一步提升模型的鲁棒性。本发明不依赖任何辅助干净数据集,并能有效抵御多种后门攻击,同时保持模型的高精度。本发明填补了现有技术在无辅助数据条件下进行鲁棒后门防御模型训练的空缺。