提示词的水印注入检测方法、装置和终端设备

    公开(公告)号:CN119808035A

    公开(公告)日:2025-04-11

    申请号:CN202411875060.8

    申请日:2024-12-18

    Abstract: 本申请涉及一种提示词的水印注入检测方法、装置和终端设备,包括:将注有初始水印令牌的提示词和提示词所对应的提问信息输入大模型,得到第一输出值,并计算第一损失函数;将提示词和初始校验令牌输入大模型,得到第二输出值,并计算第二损失函数;利用第一损失函数、第二损失函数更新初始水印令牌、初始校验令牌,得到目标水印令牌、目标校验令牌;由待检测大模型将目标校验令牌和待检测提示词组合后作为待检测大模型的最终输入,得到大模型输出的第三输出值,在第三输出值与目标验证信息的相似度达到预设阈值的情况下,确定待检测提示词注有目标水印令牌。通过本申请,解决了相关技术中大模型的更新会降低对提示词的版权追踪的有效性的问题。

    微调大语言模型的方法及电子设备

    公开(公告)号:CN119398126A

    公开(公告)日:2025-02-07

    申请号:CN202510003176.0

    申请日:2025-01-02

    Abstract: 本申请提供了一种微调大语言模型的方法及电子设备;涉及计算机技术领域。该方法包括:在第i个微调阶段,对大语言模型的参数空间进行采样,得到模型参数向量;基于模型参数向量与零阶规模参数,计算阶段损失函数的差分隐私零阶梯度;阶段损失函数为大语言模型的损失函数更新得到;基于差分隐私零阶梯度与学习率,按预设的迭代轮次对大语言模型的模型参数进行迭代处理,得到第i个微调阶段的目标模型参数;本申请实施例,可以降低微调模型的资源消耗,有效保护数据隐私的同时保证模型性能。

Patent Agency Ranking