-
公开(公告)号:CN113361762A
公开(公告)日:2021-09-07
申请号:CN202110612266.1
申请日:2021-06-02
Applicant: 南京大学
Abstract: 本发明提出了众包任务中的数据偏见处理方法。在众包数据收集阶段,需要获取足够多的数据,并且需要保证数据质量。但是在利用众包获取大量的标签数据可能会存在偏见。该方法利用可解释机器学习方法对众包数据收集的结果进行诊断,分析可能存在的机器学习方法中前处理,后处理对众包数据可能存在的偏见进行处理。数据偏见分析和诊断阶段,对数据中可能存在的偏见和模型漏洞进行分析;前处理阶段,通过前处理,包括盲点法,因果歧视法改善数据偏见,提升模型公平性;后处理阶段,通过均等机会,均等PPV等方法改善模型偏见。本发明可以比较有效地诊断数据收集过程中可能存在的偏见,并可以较为有效地消除后续可能使用数据的机器学习模型偏见。
-
公开(公告)号:CN113361611A
公开(公告)日:2021-09-07
申请号:CN202110650604.0
申请日:2021-06-11
Applicant: 南京大学
Abstract: 本发明提出了一种众包任务下的鲁棒分类器训练方法,使得训练得到的分类器结果更加鲁棒,在一定程度上可以抵御恶意对抗样本的攻击。本发明首先通过训练一个自动编码器,学习输入样例在隐空间上的表示。将输入投影到隐空间上后,进行两种处理并将损失与正常分类损失一起进行联合对抗训练,得到基本分类器f。鲁棒分类器g通过对输入样例加上高斯噪声扰动,利用蒙特卡罗方法不断查询基本分类器f,输出基本分类器输出最高的概率类别c。本发明还是一种可证明的防御,因而可以用在对安全性要求较高的任务中,在给定的安全范围内保证不会被恶意对抗样本攻击成功。
-
公开(公告)号:CN113361611B
公开(公告)日:2023-12-12
申请号:CN202110650604.0
申请日:2021-06-11
Applicant: 南京大学
IPC: G06F30/27
Abstract: 本发明提出了一种众包任务下的鲁棒分类器训练方法,使得训练得到的分类器结果更加鲁棒,在一定程度上可以抵御恶意对抗样本的攻击。本发明首先通过训练一个自动编码器,学习输入样例在隐空间上的表示。将输入投影到隐空间上后,进行两种处理并将损失与正常分类损失一起进行联合对抗训练,得到基本分类器f。鲁棒分类器g通过对输入样例加上高斯噪声扰动,利用蒙特卡罗方法不断查询基本分类器f,输出基本分类器输出最高的概率类别c。本发明还是一种可证明的防御,因而可以用在对安全性要求较高的任务中,在给定的安全范围内保证不会被恶意对抗样本攻击成功。
-
-