-
公开(公告)号:CN119848834A
公开(公告)日:2025-04-18
申请号:CN202411997927.7
申请日:2024-12-31
Applicant: 浙江大学 , 支付宝(杭州)信息技术有限公司
IPC: G06F21/55 , G06F18/20 , G06F18/213 , G06N5/04 , G06N5/025 , G06N3/045 , G06N3/0475 , G06N3/042
Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,其中,方法包括:接收针对目标用户的风险检测请求;响应于所述风险检测请求,获取包含所述目标用户的操作行为的日志数据;基于所述日志数据中包含的所述目标用户的操作行为,确定目标图结构数据,所述目标图结构数据包含根据所述操作行为确定的目标节点,以及根据所述操作行为之间的逻辑关系确定的节点之间的边;对所述目标图结构数据进行特征提取处理,得到所述目标图结构数据对应的目标图嵌入向量,并对所述日志数据进行关键信息提取处理,得到目标信息;根据大语言模型,基于所述目标图嵌入向量和所述目标信息,确定所述目标用户是否为风险用户。
-
公开(公告)号:CN118134740B
公开(公告)日:2024-07-30
申请号:CN202410553090.0
申请日:2024-05-07
Applicant: 浙江大学
Abstract: 本发明公开了一种基于非决策域方法的模型水印方法及装置,根据选择的待嵌入的水印#imgabs0#和水印提取密钥并使用可解释性方法定义待训练模型的损失函数,通过损失函数对待训练模型进行优化,得到优化后的模型;随后将待嵌入的水印嵌入到优化后的模型中,得到嵌入水印的模型;利用水印提取密钥通过可解释性方法从嵌入水印的模型中提取水印#imgabs1#;将提取出的水印#imgabs2#与待嵌入的水印#imgabs3#进行比对,确定版权归属。本申请针对传统基于后门的黑盒模型版权认证方法对模型有害、不包含任何信息和易被攻击者伪造的缺点,巧妙地采用非决策域方法,不影响模型的预测结果,能够有效地保护各类人工智能模型的版权,实现无害化、多比特、不易伪造的模型版权认证方案。
-
公开(公告)号:CN117313869A
公开(公告)日:2023-12-29
申请号:CN202311418709.9
申请日:2023-10-30
Applicant: 浙江大学
IPC: G06N5/04 , G06F21/62 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于模型分割的大模型隐私保护推理方法,属于计算机人工智能和大模型安全技术领域。通过模型分割:将原始大模型的Encoder和Decoder部署在客户端,大模型的中间部分留在服务端本地;模型压缩:通过服务器端将中间层压缩后发送至客户端,并在客户端组成一个具有原始大模型基本功能的小模型;模型微调:客户端通过损失函数微调模型;模型推理:客户端将训练好的Encoder按协议发送至服务器端,推理得到中间结果,再与本地服务器端的Decoder结合完成训练。本发明兼顾了模型性能和隐私保护,有效的防范了重建攻击,且对于模型的效果没有负面影响;同时防止了大模型的模型隐私泄露和用户的数据泄露,计算效率高,在客户端不需要大量的计算资源。
-
公开(公告)号:CN118134740A
公开(公告)日:2024-06-04
申请号:CN202410553090.0
申请日:2024-05-07
Applicant: 浙江大学
Abstract: 本发明公开了一种基于非决策域方法的模型水印方法及装置,根据选择的待嵌入的水印#imgabs0#和水印提取密钥并使用可解释性方法定义待训练模型的损失函数,通过损失函数对待训练模型进行优化,得到优化后的模型;随后将待嵌入的水印嵌入到优化后的模型中,得到嵌入水印的模型;利用水印提取密钥通过可解释性方法从嵌入水印的模型中提取水印#imgabs1#;将提取出的水印#imgabs2#与待嵌入的水印#imgabs3#进行比对,确定版权归属。本申请针对传统基于后门的黑盒模型版权认证方法对模型有害、不包含任何信息和易被攻击者伪造的缺点,巧妙地采用非决策域方法,不影响模型的预测结果,能够有效地保护各类人工智能模型的版权,实现无害化、多比特、不易伪造的模型版权认证方案。
-
公开(公告)号:CN117313869B
公开(公告)日:2024-04-05
申请号:CN202311418709.9
申请日:2023-10-30
Applicant: 浙江大学
IPC: G06N5/04 , G06F21/62 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于模型分割的大模型隐私保护推理方法,属于计算机人工智能和大模型安全技术领域。通过模型分割:将原始大模型的Encoder和Decoder部署在客户端,大模型的中间部分留在服务端本地;模型压缩:通过服务器端将中间层压缩后发送至客户端,并在客户端组成一个具有原始大模型基本功能的小模型;模型微调:客户端通过损失函数微调模型;模型推理:客户端将训练好的Encoder按协议发送至服务器端,推理得到中间结果,再与本地服务器端的Decoder结合完成训练。本发明兼顾了模型性能和隐私保护,有效的防范了重建攻击,且对于模型的效果没有负面影响;同时防止了大模型的模型隐私泄露和用户的数据泄露,计算效率高,在客户端不需要大量的计算资源。
-
公开(公告)号:CN118520440A
公开(公告)日:2024-08-20
申请号:CN202410664418.6
申请日:2024-05-27
Applicant: 浙江大学
Abstract: 本发明公开了一种基于非决策域方法的模型指纹方法及装置,根据选择的待生成的指纹w和指纹提取密钥并使用可解释性方法定义模型F的损失函数,通过损失函数对指纹提取密钥进行优化,得到优化后的指纹提取密钥;利用优化后的指纹提取密钥通过可解释性方法从模型F中提取指纹w′,与指纹w进行比对,确定版权归属。本申请针对传统的黑盒模型指纹方法中指纹不包含任何信息和易被攻击者伪造的缺点,巧妙地采用非决策域方法,不影响模型的预测结果,能够有效地保护各类人工智能模型的版权,实现多比特和不易伪造的模型版权认证方案。
-
公开(公告)号:CN118520434A
公开(公告)日:2024-08-20
申请号:CN202410664413.3
申请日:2024-05-27
Applicant: 浙江大学
IPC: G06F21/16 , G06F18/214 , G06N3/08 , G06N3/0985
Abstract: 本发明公开了一种基于非决策域方法的数据集版权认证方法及装置,根据训练数据集、测试数据集和扰动矩阵集合对辅助模型进行优化;根据待嵌入的水印w和水印提取密钥并使用可解释性方法定义优化后的辅助模型的损失函数对扰动矩阵集合进行优化,得到优化后的扰动矩阵集合;利用优化后的扰动矩阵集合将待嵌入的水印w嵌入到训练数据集,得到优化后的训练数据集;利用优化后的训练数据集对待验证模型进行训练优化,得到优化后的验证模型;利用水印提取密钥通过可解释性方法从优化后的验证模型中提取水印w′,与待嵌入的水印w进行比对,确定版权归属。本申请针对传统的基于后门的黑盒数据集版权认证方法对模型有害、不包含任何信息和易被攻击者伪造的缺点,巧妙地采用非决策域方法,在嵌入了水印的数据集上训练模型的性能不会受到影响,不影响模型的预测结果,能够有效地保护各类人工智能数据集的版权,实现无害化、多比特、不易伪造的数据集版权认证方案。
-
公开(公告)号:CN116523725A
公开(公告)日:2023-08-01
申请号:CN202310117212.7
申请日:2023-02-15
Applicant: 浙江大学杭州国际科创中心
Abstract: 本申请涉及种神经网络模型的水印处理方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:从第一待处理模型中提取部分子水印,并分别确定各所述子水印对应的关联因子;根据所述子水印的值和所述关联因子,分别确定各所述子水印与K个未知参数的关联关系,其中,K为提取的部分所述子水印的个数,所述K个未知参数中包含目标水印的值;根据K个所述关联关系求解所述目标水印的值,以得到所述目标水印。采用本方法能够实现了可以基于至少部分子水印,准确确定出目标水印,达到了提高水印处理方法鲁棒性的技术效果。
-
-
-
-
-
-
-