-
公开(公告)号:CN119808035A
公开(公告)日:2025-04-11
申请号:CN202411875060.8
申请日:2024-12-18
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
Abstract: 本申请涉及一种提示词的水印注入检测方法、装置和终端设备,包括:将注有初始水印令牌的提示词和提示词所对应的提问信息输入大模型,得到第一输出值,并计算第一损失函数;将提示词和初始校验令牌输入大模型,得到第二输出值,并计算第二损失函数;利用第一损失函数、第二损失函数更新初始水印令牌、初始校验令牌,得到目标水印令牌、目标校验令牌;由待检测大模型将目标校验令牌和待检测提示词组合后作为待检测大模型的最终输入,得到大模型输出的第三输出值,在第三输出值与目标验证信息的相似度达到预设阈值的情况下,确定待检测提示词注有目标水印令牌。通过本申请,解决了相关技术中大模型的更新会降低对提示词的版权追踪的有效性的问题。
-
公开(公告)号:CN119918510A
公开(公告)日:2025-05-02
申请号:CN202411959708.X
申请日:2024-12-28
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06F40/166 , G06F40/284 , G06F40/30 , G06N3/126 , G06F40/247 , G06F16/36 , G06N20/00
Abstract: 本申请涉及一种大模型敏感表达模糊化处理方法、系统和计算机设备,其中,该方法包括:获取原始提示词;基于原始提示词的上下文信息,对原始提示词进行扩充和压缩处理,得到第一提示词;对第一提示词中的敏感词进行语义替换处理,生成第二提示词;对第二提示词进行语义一致性增强和扩展处理,得到目标提示词。通过本申请,能够结合上下文信息对原始提示词进行扩充和压缩处理,以及敏感词的语义替换和语义一致性增强处理,对原始提示词中的敏感表达进行模糊化处理,生成更加有效的目标提示词,能够利用目标提示词更好地完善大模型的安全防护。
-
公开(公告)号:CN119398126A
公开(公告)日:2025-02-07
申请号:CN202510003176.0
申请日:2025-01-02
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06N3/082 , G06N3/0455 , G06N5/04
Abstract: 本申请提供了一种微调大语言模型的方法及电子设备;涉及计算机技术领域。该方法包括:在第i个微调阶段,对大语言模型的参数空间进行采样,得到模型参数向量;基于模型参数向量与零阶规模参数,计算阶段损失函数的差分隐私零阶梯度;阶段损失函数为大语言模型的损失函数更新得到;基于差分隐私零阶梯度与学习率,按预设的迭代轮次对大语言模型的模型参数进行迭代处理,得到第i个微调阶段的目标模型参数;本申请实施例,可以降低微调模型的资源消耗,有效保护数据隐私的同时保证模型性能。
-
-