一种针对深度伪造的主动防御方法、系统

    公开(公告)号:CN115273247A

    公开(公告)日:2022-11-01

    申请号:CN202210845845.5

    申请日:2022-07-19

    Applicant: 北京大学

    Abstract: 本发明公开了一种针对深度伪造的主动防御方法、系统,属于人工智能安全领域。本发明生成一种模型通用的主动防御水印,将该水印嵌入包含人脸信息的媒体后可使深度伪造模型的生成扭曲,并可通过该水印检测出该媒体内容是否经历过深度伪造,彻底防止深度伪造篡改。本发明对多种深度伪造模型具有防御能力,且无需深度伪造模型结构信息,即可达到防御效果。

    一种基于对抗攻击的多媒体隐私保护方法、装置及设备

    公开(公告)号:CN113076557A

    公开(公告)日:2021-07-06

    申请号:CN202110360515.2

    申请日:2021-04-02

    Applicant: 北京大学

    Inventor: 王勇涛 黄灏 汤帜

    Abstract: 本发明公布了一种基于对抗攻击的多媒体隐私保护方法、装置及设备,方法包括以下步骤:获得对多媒体样本进行侵犯的神经网络模型和原始训练数据;根据神经网络模型针对的任务类型设计出不同的损失函数,利用损失函数的值对任一原始训练数据加上首次随机扰动求梯度,得到第一次对抗扰动;循环将原始训练数据加上第一次对抗扰动后输入到所述神经网络模型中进行计算,得到输出训练数据,再次利用损失函数计算损失,将损失回传求梯度,得到本次对抗扰动;当得到对应的输出训练数据与输入原始训练数据差距变大时,保存对抗扰动结果;将对抗扰动结果作为保护水印叠加到软件端上传或硬件端生成的多媒体内容上,主动保护该多媒体内容不被恶意利用或篡改。

    一种基于对抗攻击的多媒体隐私保护方法、装置及设备

    公开(公告)号:CN113076557B

    公开(公告)日:2022-05-20

    申请号:CN202110360515.2

    申请日:2021-04-02

    Applicant: 北京大学

    Inventor: 王勇涛 黄灏 汤帜

    Abstract: 本发明公布了一种基于对抗攻击的多媒体隐私保护方法、装置及设备,方法包括以下步骤:获得对多媒体样本进行侵犯的神经网络模型和原始训练数据;根据神经网络模型针对的任务类型设计出不同的损失函数,利用损失函数的值对任一原始训练数据加上首次随机扰动求梯度,得到第一次对抗扰动;循环将原始训练数据加上第一次对抗扰动后输入到所述神经网络模型中进行计算,得到输出训练数据,再次利用损失函数计算损失,将损失回传求梯度,得到本次对抗扰动;当得到对应的输出训练数据与输入原始训练数据差距变大时,保存对抗扰动结果;将对抗扰动结果作为保护水印叠加到软件端上传或硬件端生成的多媒体内容上,主动保护该多媒体内容不被恶意利用或篡改。

    一种针对目标检测器对抗稳定性的测试方法、系统

    公开(公告)号:CN115240039A

    公开(公告)日:2022-10-25

    申请号:CN202210845988.6

    申请日:2022-07-19

    Applicant: 北京大学

    Inventor: 王勇涛 黄灏 汤帜

    Abstract: 本发明公开了一种针对目标检测器的对抗稳定性测试方法、系统,属于人工智能安全领域。本发明在攻击前生成一个随机的扰动作为初始的对抗补丁Xadv,并在后续的迭代中对该对抗补丁进行更新,最终利用训练好的对抗补丁对目标检测器进行对抗稳定性测试,并计算mAP作为量化指标。本发明通过使用已封装的模块、修改必要的外部接口,可以快速、灵活地针对目标模型实现对抗补丁式的攻击,能够满足对给定的检测器进行自定义攻击及对抗测试的要求。

Patent Agency Ranking