-
公开(公告)号:CN111401479A
公开(公告)日:2020-07-10
申请号:CN202010307728.4
申请日:2020-04-17
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种多方联合对隐私数据进行降维处理的方法和装置,在隐私数据纵向分布的情况下,第一持有方针对第一原始矩阵进行零均值化得到第一中心矩阵,获取N*N维的非对称正交矩阵,将非对称正交矩阵与第一中心矩阵相乘得到第一隐秘矩阵,将第一隐秘矩阵发送至可信第三方。可信第三方对各个隐秘矩阵进行拼接得到全局隐秘矩阵,全局隐秘矩阵与其转置矩阵相乘得到协方差矩阵,对协方差矩阵进行本征值求解得到降维变换矩阵,对降维变换矩阵进行拆分后得到各个拆分矩阵,并发送至持有方。第一持有方用第一拆分矩阵处理第一原始矩阵得到第一降维矩阵,用以通过机器学习的方式对业务对象进行业务预测分析。
-
公开(公告)号:CN111275120A
公开(公告)日:2020-06-12
申请号:CN202010075299.2
申请日:2020-01-22
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种图像识别模型的训练方法及装置、图像识别方法及装置。其中,训练方法包括:将待训练的第二图像识别模型中的每层卷积神经网络,分别与训练完的第一图像识别模型中的一个子网络相对应。根据训练完的第一图像识别模型中每个子网络的输入和输出,对待训练的第二图像识别模型中的每层卷积神经网络的参数进行初始化处理。将样本图像输入参数初始化处理后的待训练的第二图像识别模型,根据待训练的第二图像识别模型的输出和样本图像的标签,对待训练的第二图像识别模型进行训练。由此,实现了根据训练完的第一图像识别模型,对待训练的第二图像识别模型进行参数初始化处理,以加快对待训练的第二图像识别模型进行的训练。
-
公开(公告)号:CN111241570A
公开(公告)日:2020-06-05
申请号:CN202010329627.7
申请日:2020-04-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种保护数据隐私的双方联合训练业务预测模型的方法和装置,其中第一方和第二方分别拥有一部分特征数据,分别维护第一和第二参数部分。在模型迭代时,双方各自计算其特征矩阵与参数的乘积结果,第一方将其乘积结果同态加密后发送给拥有标签的第二方,由第二方进行同态运算,得到加密误差向量。然后,第二方对该加密误差向量添加混淆向量后发送给第一方,并与第一方各自采用该混淆向量和特征矩阵进行安全矩阵乘法,得到乘积分片。第二方可选的对乘积分片添加混淆,然后发给第一方。第一方由此确定出其第一梯度,据此更新其参数。
-
公开(公告)号:CN111222026A
公开(公告)日:2020-06-02
申请号:CN202010023203.8
申请日:2020-01-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/906 , G06N3/04
Abstract: 本说明书实施例公开了一种用户类别识别模型的训练方法和用户类别识别方法,训练方法包括:将样本用户的联系人列表输入用户类别计算模型,以生成样本用户属于预设类别的概率。将样本用户对应的软件特征,和样本用户属于预设类别的概率,输入用户类别识别模型,以生成样本用户的识别结果。根据样本用户的识别结果和样本用户的类别标签,对用户类别识别模型中的参数,以及样本用户的常用软件列表中每个常用软件对应的软件特征进行优化。当满足预设条件时,完成对用户类别识别模型的训练。由此,使得训练完的用户类别识别模型能够在用户信息不充分的情况下,基于待识别用户的联系人列表和对应的软件特征,实现用户类别识别。
-
公开(公告)号:CN111178549A
公开(公告)日:2020-05-19
申请号:CN202010276696.6
申请日:2020-04-10
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种保护数据隐私的双方联合训练业务预测模型的方法和装置,其中双方各自拥有一部分特征数据。在模型迭代过程中,双方通过安全矩阵乘法,得到总的特征矩阵X与总的参数矩阵W的乘积结果的两个乘积分片。拥有标签的第二方对标签向量Y进行秘密分享,使双方得到两个标签分片。于是,双方各自根据持有的乘积分片和标签分片计算出对应的误差分片。然后双方基于各自的误差分片和特征矩阵,通过秘密分享和安全矩阵乘法,得到对应的梯度分片。然后,第一方利用其梯度分片更新其维护的参数分片,第二方利用其梯度分片更新其维护的参数分片。如此实现保护数据隐私的安全联合训练。
-
公开(公告)号:CN111079946A
公开(公告)日:2020-04-28
申请号:CN201911333307.2
申请日:2019-12-20
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 周俊
Abstract: 本说明书中的实施例提供了模型训练方法、成员探测装置的训练方法及其系统,以防范成员攻击造成的数据隐私泄露。其中,成员探测装置可以基于特征数据、标签数据和模型的预测结果评估攻击者基于这些数据成功探测出该特征数据是否属于模型训练集的概率。进而,模型训练系统可以通过调节所训练模型的参数和/或结构来降低该概率。
-
公开(公告)号:CN111079939A
公开(公告)日:2020-04-28
申请号:CN201911194023.X
申请日:2019-11-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供用于基于数据隐私保护的机器学习模型特征筛选的方法。机器学习模型具有模型特征集,并且机器学习模型的特征数据被水平切分地分布在第一数据拥有方和至少一个第二数据拥有方处,每个数据拥有方具有与模型特征集对应的特征数据。第一数据拥有方和至少一个第二数据拥有方协同来使用第一数据拥有方的特征数据进行多方安全计算,以训练出待筛选模型特征的预测模型。在第一数据拥有方处,基于待筛选模型特征的预测差值确定待筛选模型特征的方差膨胀因子,以用于对待筛选模型特征进行模型特征筛选处理。
-
公开(公告)号:CN110929887A
公开(公告)日:2020-03-27
申请号:CN202010096283.X
申请日:2020-02-17
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00
Abstract: 本说明书实施例提供用于经由多个训练参与方来训练逻辑回归模型的方法和装置。在该方法中,逻辑回归模型被垂直切分为多个子模型,每个训练参与方具有一个子模型以及经过垂直切分后得到的特征数据子集。在训练时,第一训练参与方将标记值分解为多个部分标记值,并分别向各个第二训练参与方发送一个部分标记值。在各个训练参与方处,基于各自的当前子模型、特征数据子集以及部分标记值,确定该训练参与方处的预测差值。基于各个训练参与方的预测差值确定总预测差值。然后,各个训练参与方基于总预测差值和各自的特征数据子集,确定出对应的模型更新量并进行子模型更新。利用该方法,能够保证各个模型训练参与方处的私有数据的数据安全。
-
公开(公告)号:CN110807055A
公开(公告)日:2020-02-18
申请号:CN201910972979.1
申请日:2019-10-14
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 周俊
IPC: G06F16/248 , G06F16/28 , G06K9/62
Abstract: 本申请涉及一种用于对数据库执行查询的方法,包括:接收来自用户的客户端的对数据库的查询;对所述数据库执行所述查询;在所述查询期间或查询完成后自动地使用机器学习算法对所述查询的结果执行汇聚以生成汇聚结果;以及向所述用户的客户端返回所述汇聚结果以供呈现。本申请还涉及相应的系统和计算机可读介质。本申请能够更直观高效地呈现有价值的数据库查询结果。
-
公开(公告)号:CN110795603A
公开(公告)日:2020-02-14
申请号:CN201911040223.X
申请日:2019-10-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/901 , G06F21/62 , G06Q10/04
Abstract: 本说明书实施例提供了一种保护隐私的树模型构建方法和装置及基于该树模型的预测方法和装置,所述构建方法包括:从至少两个数据方各自的设备获取M组分裂结果,M组分裂结果与M个特征分别对应;记录M组分裂结果各自对应的数据方;基于N个样本各自的标签值,分别计算各个分裂结果的分裂增益;获取具有最大分裂增益的分裂结果作为最优分裂结果;在最优分裂结果的分裂增益为正值的情况中,确定最优分裂结果对应的数据方;在对应的数据方为第二数据方的情况中,将最优分裂结果发送给第二数据方的设备,并记录第一节点与第二数据方的对应关系;对第一节点进行标注,以指示本地没有第一节点的节点数据,并相应地更新所述第一树的树结构。
-
-
-
-
-
-
-
-
-