-
公开(公告)号:CN115273247A
公开(公告)日:2022-11-01
申请号:CN202210845845.5
申请日:2022-07-19
Applicant: 北京大学
Abstract: 本发明公开了一种针对深度伪造的主动防御方法、系统,属于人工智能安全领域。本发明生成一种模型通用的主动防御水印,将该水印嵌入包含人脸信息的媒体后可使深度伪造模型的生成扭曲,并可通过该水印检测出该媒体内容是否经历过深度伪造,彻底防止深度伪造篡改。本发明对多种深度伪造模型具有防御能力,且无需深度伪造模型结构信息,即可达到防御效果。
-
公开(公告)号:CN117333345A
公开(公告)日:2024-01-02
申请号:CN202311261160.7
申请日:2023-09-27
Applicant: 北京大学
IPC: G06T1/00 , G06V10/774 , G06V10/764 , G06V10/74
Abstract: 本发明涉及一种防御文本生成图像模型微调的通用对抗水印生成方法和系统。该方法包括:获取生成通用对抗水印所需的训练数据;利用训练数据攻击文本生成图像模型中的变分自动编码器,生成通用对抗水印;训练分类器,通过识别图片中出现的扰动和扭曲,判断图片是否为微调后的文本生成图像模型生成;利用训练完成的分类器识别待检测图片中是否含有通用对抗水印引入的扰动,进而判断待检测图片是否为微调后的文本生成图像模型生成的图片。本发明生成一种对模型、图片以及多种微调方法通用的主动防御水印,嵌入需要保护的媒体后,可检测出该媒体内容是否被利用于文本生成图像模型的微调训练,彻底防止文本生成图像模型利用该媒体进行微调训练。
-