一种针对神经网络算法投毒攻击的鲁棒训练方法

    公开(公告)号:CN116484274A

    公开(公告)日:2023-07-25

    申请号:CN202310363794.7

    申请日:2023-04-07

    Abstract: 本发明涉及一种针对神经网络算法投毒攻击的鲁棒训练方法,属于人工智能安全技术领域。该方法包括步骤:构建神经网络;构建鲁棒训练损失函数;使用包含投毒样本的训练集对神经网络进行预训练,得到神经网络预训练模型;根据神经网络预训练模型,获得包含投毒样本的训练集被预测为真实标签的概率,过滤预测概率低于过滤阈值的样本,从而剔除投毒样本,得到干净的训练集;使用干净的训练集对神经网络预训练模型进行再训练,得到神经网络模型;对神经网络模型进行性能测试。本发明利用模型预测结果与单调递增函数实现样本权重的自适应更新,增大投毒样本与干净样本的权重差异,降低了神经网络模型拟合投毒样本的风险,提高神经网络模型分类的准确率。

Patent Agency Ranking