-
公开(公告)号:CN111738453B
公开(公告)日:2020-12-01
申请号:CN202010762022.7
申请日:2020-07-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00
Abstract: 本说明书实施例提供基于样本加权的业务模型训练方法及系统。第一和第二数据拥有方分别具有第一和第二数据集以及第一和第二模型。第一数据拥有方包括具有标签权重的数据标签。各个数据拥有方对所具有的模型和标签权重进行份额分解并进行共享。在各个数据拥有方之间,使用各个模型份额、第一和第二数据集以及数据标签,确定各个模型的模型更新量份额。在各个数据拥有方之间,使用各个模型的模型更新量份额以及标签权重份额,确定各个模型的加权模型更新量份额。各个数据拥有方根据各个加权模型更新量份额更新对应的模型份额。在循环结束时,各个数据拥有方共享更新后的模型份额,并根据更新后的模型份额确定训练出的第一和第二模型。
-
公开(公告)号:CN111738359B
公开(公告)日:2020-11-27
申请号:CN202010722953.4
申请日:2020-07-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种两方决策树训练方法和系统,以保护双方的数据隐私。对于任一方的特征,另一方的设备在密文形态下计算该特征下的各分组分别对应的梯度和,并将计算出的梯度和的密文转换成梯度和的一个分片和梯度和的另一个分片的密文,将梯度和的另一个分片的密文发送给所述任一方的设备。其中,密文的加密算法为同态加密算法,密文的加密密钥为所述任一方的公钥。两方的设备按照多方安全计算协议进行交互,以基于各特征下的各分组分别对应的梯度和的分片计算各特征下的各分组分别对应的分裂增益的分片。进而,两方的设备通过多方安全比较协议确定最大分裂增益对应的特征及分组,并按最大分裂增益对应的特征及分组分裂节点。
-
公开(公告)号:CN111737756B
公开(公告)日:2020-11-24
申请号:CN202010759820.4
申请日:2020-07-31
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供基于两个数据拥有方的XGB模型预测方法及装置。各个数据拥有方的本地预测数据按照垂直切分方式组成XGB模型的预测数据,各个数据拥有方的本地叶结点权重向量基于秘密分享处理得到。各个数据拥有方使用本地子模型结构进行叶结点预测得到各棵树的本地叶结点标志向量,确定各棵树的本地叶结点标志向量与本地叶结点权重向量之间的本地积向量并进行同态加密处理后共享给对端数据拥有方。各个数据拥有方根据本地叶结点标志向量和本地积向量以及对端数据拥有方共享的叶结点标志向量和积向量,确定各自预测值密文并共享给对端数据拥有方。各个数据拥有方使用本地密钥对从对端数据拥有方获取的预测值密文解密,得到各自的模型预测值。
-
公开(公告)号:CN111738441B
公开(公告)日:2020-11-17
申请号:CN202010759897.1
申请日:2020-07-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/08 , G06N3/04 , G06F21/62 , G06F16/9535 , G06Q30/06
Abstract: 本说明书实施例提供一种兼顾预测精度和隐私保护的预测模型训练方法及装置。预测模型包括特征提取层和预测层,在对预测模型进行训练时,针对包含第一对象的第一原始特征和第一标签的第一样本,可以从第一原始特征中提取第一对象在多个隐私属性方面的第一实际值;将第一原始特征输入特征提取层,得到第一提取特征;将第一提取特征输入预测层,得到第一预测信息;基于第一预测信息与第一标签之间的差异确定第一预测损失;将第一提取特征输入预先训练的隐私保护模型,得到第一对象在多个隐私属性方面的第一预测值,基于第一预测值和第一实际值之间的差异,确定第二预测损失;向减小第一预测损失、增大第二预测损失的方向,更新所述特征提取层。
-
公开(公告)号:CN111931950A
公开(公告)日:2020-11-13
申请号:CN202011044286.5
申请日:2020-09-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/20
Abstract: 本说明书一个或多个实施例涉及一种基于联邦学习进行模型参数更新的方法及系统,可用于机器学习过程中的隐私数据保护,所述方法由参与方中的任一训练成员实现;其包括:获取具有与其他参与方相同结构的待训练初始模型;进行多次模型参数迭代更新,每次迭代包括:基于自身持有的训练样本进行模型训练,获得当前次迭代对应的模型数据矩阵;确定当前次迭代对应的传输比例,所述传输比例与迭代次数负相关;基于所述传输比例从所述模型数据矩阵中提取部分参数元素;基于所述部分参数元素生成参数传输矩阵;将所述参数传输矩阵上传给所述服务器;从所述服务器获取更新后的模型参数以基于此进行下一次迭代,或者基于此确定最终模型。
-
公开(公告)号:CN111931216A
公开(公告)日:2020-11-13
申请号:CN202010974956.7
申请日:2020-09-16
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/60
Abstract: 本说明书一个或多个实施例涉及一种基于隐私保护的方式获取联合训练模型的方法及系统,所述方法由参与方中的第一终端实现;其中,所述参与方包括第一终端与第二终端,分别持有水平或者垂直切分的训练数据,所述训练数据包括含样本标签的第一训练数据以及不含样本标签的第二训练数据;所述方法包括:基于含样本标签的所述第一训练数据通过隐私保护的方式与所述参与方中的第二终端联合训练第一模型;将不含标签的第二训练数据通过隐私保护的方式输入训练好的所述第一模型得到第二训练数据的预测标签;基于含样本标签的第一训练数据以及含预测标签的第二训练数据通过隐私保护的方式与所述第二终端联合训练模型,获取第二模型。
-
公开(公告)号:CN111681059B
公开(公告)日:2020-11-13
申请号:CN202010819192.4
申请日:2020-08-14
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种行为预测模型的训练方法,包括:先确定针对目标对象的多个样本用户,其中任一的第一样本用户对应第一样本硬标签,指示是否对该目标对象做出特定行为;再基于利用训练后的图神经网络对用户‑对象二部图进行图嵌入处理而确定的嵌入向量集,确定对应于第一样本用户的样本用户特征向量以及对应于目标对象的目标对象特征向量,进而确定第一样本用户对目标对象做出特定行为的特定行为概率,作为第一样本软标签,并且,将该样本用户特征向量输入第一行为预测模型中,得到行为预测结果;利用基于该预测结果和第一样本硬标签确定的第一损失项,以及基于该预测结果和第一样本软标签确定的第二损失项,训练该第一行为预测模型。
-
公开(公告)号:CN111738453A
公开(公告)日:2020-10-02
申请号:CN202010762022.7
申请日:2020-07-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00
Abstract: 本说明书实施例提供基于样本加权的业务模型训练方法及系统。第一和第二数据拥有方分别具有第一和第二数据集以及第一和第二模型。第一数据拥有方包括具有标签权重的数据标签。各个数据拥有方对所具有的模型和标签权重进行份额分解并进行共享。在各个数据拥有方之间,使用各个模型份额、第一和第二数据集以及数据标签,确定各个模型的模型更新量份额。在各个数据拥有方之间,使用各个模型的模型更新量份额以及标签权重份额,确定各个模型的加权模型更新量份额。各个数据拥有方根据各个加权模型更新量份额更新对应的模型份额。在循环结束时,各个数据拥有方共享更新后的模型份额,并根据更新后的模型份额确定训练出的第一和第二模型。
-
公开(公告)号:CN111738238A
公开(公告)日:2020-10-02
申请号:CN202010820141.3
申请日:2020-08-14
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种人脸识别方法和装置,方法包括:终端设备利用第二公钥对待识别人脸图像进行同态加密得到加密人脸图像;向服务器发送识别请求,包括加密人脸图像和第二公钥;服务器对加密人脸图像进行同态特征处理并同态添加第一混淆;对预先存储的密态人脸特征同态添加第二混淆;从服务器接收混淆加密输出特征和混淆加密人脸特征;利用与第一公钥对应的第一私钥对混淆加密人脸特征进行解密,得到第一中间值;利用与第二公钥对应的第二私钥对混淆加密输出特征进行解密,得到第二中间值;计算第二中间值与第一中间值的差值;向服务器发送差值,服务器确定待识别人脸图像与目标用户是否匹配。能够提高人脸识别的安全性和响应速度。
-
公开(公告)号:CN111737753A
公开(公告)日:2020-10-02
申请号:CN202010722393.2
申请日:2020-07-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供基于数据隐私保护的两方数据聚类方法、装置及系统。在各个数据拥有方处,分别将各自具有的数据集中的各个数据样本切分为两个数据份额。各个数据拥有方将所切分出的各个数据样本的两个数据份额中的一个数据份额共享给另一数据拥有方。在各个数据拥有方处,分别基于该数据拥有方保留的各个数据样本的数据份额以及从另一数据拥有方获取的各个数据样本的数据份额得到该数据拥有方的重组数据集。在各个数据拥有方之间,使用各个数据拥有方的重组数据集来进行数据聚类。
-
-
-
-
-
-
-
-
-