基于梯度平均的人工智能图像识别对抗攻击方法及系统

    公开(公告)号:CN117079053A

    公开(公告)日:2023-11-17

    申请号:CN202311115161.0

    申请日:2023-08-31

    Abstract: 本发明涉及图像识别技术领域,特别涉及一种基于梯度平均的人工智能图像识别对抗攻击方法及系统,通过在迭代优化中对原始输入样本进行多次图像变换并获取多个图像变换后的图像样本;利用预训练的模型获取对变换后图像样本的模型输出,并基于目标损失函数得到模型输出与原始样本集中样本输入真实标签两者的交叉熵,利用交叉熵损失求解变换后图像样本的梯度,并计算多个变换后图像样本梯度的平均值,利用该梯度平均值求解对抗扰动,并在下一轮迭代优化中将对抗扰动添加至原始输入样本,以通过迭代优化来生成用于对模型进行对抗攻击的对抗样本。本发明通过梯度取平均来减轻随机性过大的影响,生成更具迁移性的对抗样本。

Patent Agency Ranking