-
公开(公告)号:CN119358605A
公开(公告)日:2025-01-24
申请号:CN202411924814.4
申请日:2024-12-25
Applicant: 蚂蚁智信(杭州)信息技术有限公司
IPC: G06N3/0475 , G06N3/094 , G06N3/045 , G06N3/0464 , G06N3/044 , G06F18/214 , G06F40/30 , G06V10/82 , G06V10/774 , G06V20/70
Abstract: 本说明书实施例公开了一种用于生成对抗攻击样本的方法、装置、存储介质及电子设备,将风险图片及初始的第一提示词输入图生文大模型,获得所述图生文大模型输出的所述风险图片对应的第一文本描述信息;通过对所述第一文本描述信息进行风险隐晦程度评估,对所述第一提示词进行优化;将所第一文本描述信息输入代理文生图大模型,获得所述代理文生图大模型输出的所述第一文本描述信息对应的输出图片;通过对所述输出图片进行风险评估,对第一提示词进行优化;确定所述输出图片是否存在风险;若是,保存所述第一文本描述信息;重新将所述风险图片及优化后的第一提示词输入所述图生文大模型,以此循环,获得文生图对抗攻击样本。