一种后门防御中消除共享对抗样本的方法及后门防御系统

    公开(公告)号:CN117390622A

    公开(公告)日:2024-01-12

    申请号:CN202310853692.3

    申请日:2023-07-12

    Abstract: 本发明公开了一种后门防御中消除共享对抗样本的方法,步骤1、确定中毒模型和纯化模型中的共享对抗样本;步骤2、利用标准样本和共享对抗样本训练纯化模型;步骤3、重复步骤1,判断中毒模型和训练后的纯化模型是否存在共享对抗样本;如是,重复步骤2至3,如否,则纯化模型达到预设条件,终止循环。本发明通过找到中毒模型和纯化模型的共享对抗样本,优化纯化模型以消除共享对抗样本,从而帮助纯化模型中后门的移除;本发明提出了减轻中毒模型中后门攻击的双层公式。适用于后门有毒模型的纯化,可以作为底层技术辅助基于对抗扰动的现有后门防御方法,达到最大程度的移除后门的同时保护了模型的效能,提高了模型的鲁棒性,保持了模型的高精度。

    基于图神经网络的支付监管模型可信评估方法

    公开(公告)号:CN119477322A

    公开(公告)日:2025-02-18

    申请号:CN202411592409.7

    申请日:2024-11-08

    Abstract: 本发明属于可信人工智能技术领域,具体公开了一种基于图神经网络的支付监管模型可信评估方法,包括训练用于对图神经网络中节点进行分类的支付监管模型;将图神经网络的边界节点和对应标签作为干净指纹序列;将通过可疑篡改模型得到的图神经网络的边界节点和对应标签作为可疑指纹序列;根据干净指纹序列和可疑指纹序列,确定支付监管模型的安全性。本发明首次提出了在支付监管模型场景下的五大维度评估定义,包括隐私性、可解释性、安全性、鲁棒性和公平性。五大维度全面覆盖了支付监管模型的核心评估领域,填补了业界在此领域的空白。本发明提供的支付监管模型可信评估方法,对于推动支付监管模型的发展和完善具有重要意义。

Patent Agency Ranking