-
公开(公告)号:CN112365344A
公开(公告)日:2021-02-12
申请号:CN202110028140.X
申请日:2021-01-11
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种业务规则自动生成方法和系统。所述方法包括:获取多个样本的业务数据,每个样本的业务数据包括该样本的标签数据和N个特征对应的特征数据,N为不小于2的整数;基于多个样本的特征数据进行因果图学习,得到一个或多个因果图,所述因果图包括两个以上存在因果关联的特征;对于一个或多个因果图中的任一个,利用多个样本的标签数据和在该因果图中的特征对应的特征数据训练树模型;基于训练出的树模型生成业务规则。
-
公开(公告)号:CN112100628B
公开(公告)日:2021-02-05
申请号:CN202011280172.0
申请日:2020-11-16
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种保护神经网络模型安全的方法,包括:获取神经网络模型,其中包括利用训练数据训练得到的多个网络层;针对其中任意的第一网络层,在固定其他网络层参数的情况下,利用上述训练数据对该第一网络层进行第一调参,得到第一微调模型;确定该第一微调模型对应预设性能指标的第一指标值,该预设性能指标的指标值取决于对应模型,在测试数据上的测试损失和在上述训练数据上的训练损失之间的相对大小;同理,利用训练数据和测试数据对该第一网络层进行第二调参,得到第二微调模型,并确定第二指标值;基于第一指标值和第二指标值的相对大小,确定第一网络层对应的信息敏感度,在其大于预定阈值的情况下,对第一网络层进行安全处理。
-
公开(公告)号:CN112288088A
公开(公告)日:2021-01-29
申请号:CN202011585759.2
申请日:2020-12-29
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供用于经由多个成员设备训练业务模型的方法、装置及系统。第一和第二成员设备分别具有第一和第二数据,第一和第二数据按照垂直切分方式组成用于模型训练的训练样本集,并且第一成员设备具有训练样本的标签数据。在每次循环时,各个成员设备协同,使用当前训练样本训练出当前业务模型并得到当前训练样本的模型预测结果。在第一成员设备处根据模型预测结果确定出当前训练样本中的预测误差最大的第一训练样本,并将第一训练样本的样本标识发送给各个第二成员设备。各个成员设备协同来从未使用训练样本中选择出与第一训练样本相似的第二训练样本,作为下一循环过程的当前训练样本。
-
公开(公告)号:CN111783130B
公开(公告)日:2021-01-29
申请号:CN202010919436.6
申请日:2020-09-04
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书提供一种隐私保护的数据处理方法、装置及服务器。一个方法实施例中,将秘密分享中的加法分片转化成乘法分片,进而可在基于隐私保护的浮点数平方根倒数算法中引入快速平方根算法的高精度初始化,从而减少后续基于隐私保护的牛顿法的迭代次数,在保护用户隐私的同时提高了算法效率,提高了计算设备的处理性能。
-
公开(公告)号:CN112200257A
公开(公告)日:2021-01-08
申请号:CN202011112696.9
申请日:2020-10-16
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/62 , G06N20/00 , G06F16/903
Abstract: 本说明书实施例提供一种对抗样本的生成方法,所述对抗样本对应m维样本向量,用于攻击特定模型;该方法包括:确定m维空间的n维子空间所对应的m*n维投影矩阵,再基于该m*n维投影矩阵,对当前对抗样本进行多轮迭代更新,其中任一轮迭代更新包括:先从该n维子空间中随机采样b个高斯向量;接着,利用该m*n维投影矩阵,将所述b个高斯向量映射回该m维空间,得到b个干扰向量;再将所述b个干扰向量分别添加至当前对抗样本对应的样本向量,得到b个查询样本,并查询该所述b个查询样本是否对所述特定模型攻击成功;再基于b个干扰向量和对应的b个查询结果,估计样本梯度向量,并利用该样本梯度向量,更新上述当前对抗样本。
-
公开(公告)号:CN111324911B
公开(公告)日:2021-01-01
申请号:CN202010409778.3
申请日:2020-05-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/62
Abstract: 本说明书实施例公开了一种隐私数据保护方法、系统及装置。该方法包括:分别从至少两个数据源处获取隐私数据。对所述至少两个数据源的隐私数据执行第一处理操作,以获取至少两份第一处理数据,其中,所述第一处理操作用于对隐私数据的至少一部分进行隐匿。对第一处理数据执行第二处理操作,以获取第二处理数据,其中,所述第二处理操作用于将源自至少两个数据源的第一处理数据进行混合后划分为至少两个批次。依次传输所述第二处理数据中的至少两个批次至可信执行环境执行第三处理操作,其中,所述第三处理操作用于基于第二处理数据恢复出至少一份隐私数据中的至少一部分,并对所述至少一部分进行数据处理。
-
公开(公告)号:CN112100628A
公开(公告)日:2020-12-18
申请号:CN202011280172.0
申请日:2020-11-16
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种保护神经网络模型安全的方法,包括:获取神经网络模型,其中包括利用训练数据训练得到的多个网络层;针对其中任意的第一网络层,在固定其他网络层参数的情况下,利用上述训练数据对该第一网络层进行第一调参,得到第一微调模型;确定该第一微调模型对应预设性能指标的第一指标值,该预设性能指标的指标值取决于对应模型,在测试数据上的测试损失和在上述训练数据上的训练损失之间的相对大小;同理,利用训练数据和测试数据对该第一网络层进行第二调参,得到第二微调模型,并确定第二指标值;基于第一指标值和第二指标值的相对大小,确定第一网络层对应的信息敏感度,在其大于预定阈值的情况下,对第一网络层进行安全处理。
-
公开(公告)号:CN112084476A
公开(公告)日:2020-12-15
申请号:CN202010908350.3
申请日:2020-09-02
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书提供一种生物识别身份验证方法、客户端、服务器、设备及系统,可以利用服务器将生物识别模型进行拟合,获得生物识别函数,将生物识别函数以及生物特征发送至客户端,由客户端本地保存。当客户端接收到生物验证请求后,客户端可以利用本地存储的生物识别函数以及生物样本特征对用户进行身份验证。客户端在对用户进行身份验证时,不需要与服务器进行通信,直接利用本地存储的数据即可以进行,实现了离线状态下的生物识别身份验证,同时,将生物识别模型拟合成为生物识别函数,降低了计算的复杂度,提高了本地生物识别的速度。
-
公开(公告)号:CN111738453B
公开(公告)日:2020-12-01
申请号:CN202010762022.7
申请日:2020-07-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00
Abstract: 本说明书实施例提供基于样本加权的业务模型训练方法及系统。第一和第二数据拥有方分别具有第一和第二数据集以及第一和第二模型。第一数据拥有方包括具有标签权重的数据标签。各个数据拥有方对所具有的模型和标签权重进行份额分解并进行共享。在各个数据拥有方之间,使用各个模型份额、第一和第二数据集以及数据标签,确定各个模型的模型更新量份额。在各个数据拥有方之间,使用各个模型的模型更新量份额以及标签权重份额,确定各个模型的加权模型更新量份额。各个数据拥有方根据各个加权模型更新量份额更新对应的模型份额。在循环结束时,各个数据拥有方共享更新后的模型份额,并根据更新后的模型份额确定训练出的第一和第二模型。
-
公开(公告)号:CN111738359B
公开(公告)日:2020-11-27
申请号:CN202010722953.4
申请日:2020-07-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种两方决策树训练方法和系统,以保护双方的数据隐私。对于任一方的特征,另一方的设备在密文形态下计算该特征下的各分组分别对应的梯度和,并将计算出的梯度和的密文转换成梯度和的一个分片和梯度和的另一个分片的密文,将梯度和的另一个分片的密文发送给所述任一方的设备。其中,密文的加密算法为同态加密算法,密文的加密密钥为所述任一方的公钥。两方的设备按照多方安全计算协议进行交互,以基于各特征下的各分组分别对应的梯度和的分片计算各特征下的各分组分别对应的分裂增益的分片。进而,两方的设备通过多方安全比较协议确定最大分裂增益对应的特征及分组,并按最大分裂增益对应的特征及分组分裂节点。
-
-
-
-
-
-
-
-
-