一种基于对抗性扰动的深度学习模型公平性提升系统及方法

    公开(公告)号:CN114419379A

    公开(公告)日:2022-04-29

    申请号:CN202210320949.4

    申请日:2022-03-30

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于对抗性扰动的深度学习模型公平性提升系统及方法,包含部署模型、扰动生成器和判别器,部署模型包括特征提取器和标签预测器,扰动生成器与特征提取器相连,本发明通过对输入图像进行修改,防止部署模型提取到数据的敏感特征,在不改变模型的情况下提升公平性。本发明对部署模型的输入数据进行处理,不需要改动深度学习模型。基于对抗性扰动来提升模型公平性,并且设计了相应的扰动生成器和判别器,使用判别器捕捉公平性相关的敏感属性信息,指导扰动生成器的训练优化,产生对抗性扰动隐藏数据敏感属性信息,并保留目标任务相关信息,避免让模型在特征提取过程中抽取到输入数据的敏感信息,从而提升预测公平性。

Patent Agency Ranking