基于知识蒸馏的代码预训练模型对抗样本生成方法及系统

    公开(公告)号:CN117350364A

    公开(公告)日:2024-01-05

    申请号:CN202311340360.1

    申请日:2023-10-16

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于知识蒸馏的代码预训练模型对抗样本生成方法及系统。所述方法包括以下步骤:S1、获取包括多个样本的开源数据集;S2、获取预训练代码模型,并基于鲁棒性感知的知识蒸馏建立预训练代码模型对应的若干个最优学生模型;S3、使用样本攻击最优学生模型,提取攻击成功的样本作为对抗样本;S4、使用对抗样本攻击预训练代码模型,提取攻击成功的对抗样本组成对抗集合。对抗集合即为生成的对抗样本。相应地,所述系统包括开源数据搜集模块、鲁棒性感知的知识蒸馏模块、攻击学生模型模块、预训练代码模型攻击模块。本发明基于知识蒸馏的代码预训练模型对抗样本生成方法及系统具有鲁棒性高、样本可迁移、攻击效果好的特点。

    一种面向代码模型中分类任务的后门攻击方法及系统

    公开(公告)号:CN118312957A

    公开(公告)日:2024-07-09

    申请号:CN202410505753.1

    申请日:2024-04-25

    Applicant: 扬州大学

    Abstract: 本发明公开了一种面向代码模型中分类任务的后门攻击方法及系统。后门攻击方法包括:S1、收集并预处理干净样本,得到重要性变量名;S2、在干净样本中,按照标签类别对变量名分类,得到多个触发集;同时从干净样本中选取目标标签;S3、将目标标签对应的触发集中的变量名进行C分数计算;在干净样本中,将C分数最大的变量名替换重要性变量名,预测替换后的标签,重复上述过程直至标签变化为目标标签,此时替换后的干净样本为中毒样本,将中毒样本中替换产生的变量名作为触发器;S4、将中毒样本中的触发器随机插入干净样本,形成负样本;采用基于负样本、中毒样本、干净样本得到的攻击模型进行攻击。本发明具有简单、隐蔽性强、误触率低的特点。

Patent Agency Ranking