一种基于自定义后门行为的触发器样本检测方法
摘要:
本发明公开了一种基于自定义后门行为的在线输入样本检测方法,包括自定义触发器构造;自定义后门注入;输入样本拟合程度测算;干净数据拟合程度收集;触发器样本检测阈值确认等步骤。本发明基于自定义触发器向模型注入自定义后门,通过嵌入自定义触发器干扰输入样本的预测过程且不影响输入样本的主要组件,保证本发明的鲁棒性;其次,基于干扰机制测算输入样本的拟合程度,由于触发器样本具有过拟合特性,以干净数据的拟合程度执行异常检测能够识别触发器样本,显著提高了触发器样本的检测成功率,同时不影响干净样本的分类精度;本发明操作简洁且容易部署,仅需少量预测行为即可识别触发器样本并拒绝提供服务,大大降低了防御者的资源开销。
0/0