提示词的水印注入检测方法、装置和终端设备

    公开(公告)号:CN119808035A

    公开(公告)日:2025-04-11

    申请号:CN202411875060.8

    申请日:2024-12-18

    Abstract: 本申请涉及一种提示词的水印注入检测方法、装置和终端设备,包括:将注有初始水印令牌的提示词和提示词所对应的提问信息输入大模型,得到第一输出值,并计算第一损失函数;将提示词和初始校验令牌输入大模型,得到第二输出值,并计算第二损失函数;利用第一损失函数、第二损失函数更新初始水印令牌、初始校验令牌,得到目标水印令牌、目标校验令牌;由待检测大模型将目标校验令牌和待检测提示词组合后作为待检测大模型的最终输入,得到大模型输出的第三输出值,在第三输出值与目标验证信息的相似度达到预设阈值的情况下,确定待检测提示词注有目标水印令牌。通过本申请,解决了相关技术中大模型的更新会降低对提示词的版权追踪的有效性的问题。

    一种基于非决策域方法的模型指纹方法及装置

    公开(公告)号:CN118520440A

    公开(公告)日:2024-08-20

    申请号:CN202410664418.6

    申请日:2024-05-27

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于非决策域方法的模型指纹方法及装置,根据选择的待生成的指纹w和指纹提取密钥并使用可解释性方法定义模型F的损失函数,通过损失函数对指纹提取密钥进行优化,得到优化后的指纹提取密钥;利用优化后的指纹提取密钥通过可解释性方法从模型F中提取指纹w′,与指纹w进行比对,确定版权归属。本申请针对传统的黑盒模型指纹方法中指纹不包含任何信息和易被攻击者伪造的缺点,巧妙地采用非决策域方法,不影响模型的预测结果,能够有效地保护各类人工智能模型的版权,实现多比特和不易伪造的模型版权认证方案。

    一种基于非决策域方法的数据集版权认证方法及装置

    公开(公告)号:CN118520434A

    公开(公告)日:2024-08-20

    申请号:CN202410664413.3

    申请日:2024-05-27

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于非决策域方法的数据集版权认证方法及装置,根据训练数据集、测试数据集和扰动矩阵集合对辅助模型进行优化;根据待嵌入的水印w和水印提取密钥并使用可解释性方法定义优化后的辅助模型的损失函数对扰动矩阵集合进行优化,得到优化后的扰动矩阵集合;利用优化后的扰动矩阵集合将待嵌入的水印w嵌入到训练数据集,得到优化后的训练数据集;利用优化后的训练数据集对待验证模型进行训练优化,得到优化后的验证模型;利用水印提取密钥通过可解释性方法从优化后的验证模型中提取水印w′,与待嵌入的水印w进行比对,确定版权归属。本申请针对传统的基于后门的黑盒数据集版权认证方法对模型有害、不包含任何信息和易被攻击者伪造的缺点,巧妙地采用非决策域方法,在嵌入了水印的数据集上训练模型的性能不会受到影响,不影响模型的预测结果,能够有效地保护各类人工智能数据集的版权,实现无害化、多比特、不易伪造的数据集版权认证方案。

    一种基于深度学习的肝段分割方法及装置

    公开(公告)号:CN113658186A

    公开(公告)日:2021-11-16

    申请号:CN202110823903.X

    申请日:2021-07-21

    Abstract: 本发明提供一种基于深度学习的肝段分割方法及装置。所述方法包括:将静脉期CT图像输入到第一卷积神经网络,通过下采样减小图像尺寸,输出第一阶段的肝段预分割结果;对第一阶段的肝段预分割结果和原始输入CT图像一起对层维度进行滑窗处理后,共同输入到第二卷积神经网络进行进一步分割,输出第二阶段的肝段分割结果;对第二阶段的肝段分割结果进行后处理,得到最终分割结果。本发明基于深度学习自主学习影像中肝段的特征,不需要进行专门的血管分割步骤,相对现有技术降低了血管分割难度,简化了分割步骤,提高了鲁棒性。本发明在第一阶段粗分割的基础上进行第二阶段的细分割,可以获得明显的全局特征,并使分割结果更加准确。

    一种生成内容来源判断方法、装置和存储介质

    公开(公告)号:CN117892142A

    公开(公告)日:2024-04-16

    申请号:CN202410013254.0

    申请日:2024-01-04

    Abstract: 本发明公开了一种生成内容来源判断方法,该方法基于由生成模型生成的目标类别样本集训练得到目标上下文向量,由随机获得的非目标类别样本集训练得到非目标上下文向量,将待测样本的文本特征分别与目标上下文向量的提示词特征和非目标上下文向量的提示词特征进行比较,如果接近目标上下文向量的提示词特征则证明该待测样本来源与生成模型,本发明利用上述过程首次提出了准确识别来源的方法。本发明还公开了一种生成内容来源判断装置和存储介质。

Patent Agency Ranking