一种基于有损图像压缩的深度学习模型后门构造方法

    公开(公告)号:CN115147647A

    公开(公告)日:2022-10-04

    申请号:CN202210739513.9

    申请日:2022-06-28

    Inventor: 张安楠 顾宏 秦攀

    Abstract: 本发明属于深度学习系统安全技术领域,一种基于有损图像压缩的深度学习模型后门构造方法。从训练数据集中的每个标签类选取部分原始图像作为待投毒样本;通过基于DCT变换的有损图像压缩技术对待投毒样本进行图像压缩并将待投毒样本的标签类修改为目标标签类别,得到中毒样本;中毒样本与其余干净样本混合得到中毒训练集;使用中毒训练集训练模型或将其作为第三方数据集直接由用户训练,从而得到含有后门漏洞的深度学习图像分类模型;该模型对正常输入样本保持正常性能的预测,同时会将经过有损图像压缩的中毒图像预测为攻击目标类标签。本发明隐蔽性强、抗压缩、省时高效且健壮,使后门攻击的威胁性大大增加,为深度学习模型安全性研究作出了贡献。

Patent Agency Ranking