-
公开(公告)号:CN111291895B
公开(公告)日:2022-06-28
申请号:CN202010054042.9
申请日:2020-01-17
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00
Abstract: 本说明书实施例提供一种组合特征评估模型的样本生成和训练方法及装置。在样本生成阶段,从第一样本包括M1维特征中选取待组合的多个特征维度,对于多个特征维度中的各个特征维度,根据N1个第一样本在该特征维度下的特征值分布,确定该特征维度的第一元特征;基于第一组合规则对N1个第一样本在多个特征维度下的特征值进行组合,得到第一组合特征;基于第一组合特征的特征值分布和N1个第一样本的第一标注数据,确定第一组合特征对提升业务预测模型预测效果的第一价值,并基于第一价值生成第二标注数据,通过多个特征维度各自的第一元特征、第一组合规则和第二标注数据,确定第二样本。在模型训练阶段,使用第二样本对组合特征评估模型进行训练。
-
公开(公告)号:CN112632620A
公开(公告)日:2021-04-09
申请号:CN202011621141.7
申请日:2020-12-30
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书涉及机器学习领域,特别涉及一种增强隐私保护的联邦学习方法和系统。所述方法由多个参与方中的任一训练成员实现,其中,所述参与方包括服务器及多个训练成员,该方法包括:获取隐私样本;获取一个或多个与所述隐私样本同类型的扰动样本;基于所述隐私样本与一个或多个扰动样本生成加密样本;基于所述加密样本,与其他参与方进行联邦学习以对待训练模型进行联合训练。
-
公开(公告)号:CN111475855B
公开(公告)日:2020-12-25
申请号:CN202010590733.0
申请日:2020-06-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/62
Abstract: 本说明书实施例提供一种实现隐私保护的数据处理方法,包括:先获取多个终端传感器采集到的多条原始传感器数据,构成原始数据记录,以及获取对应的针对用户的业务标签;然后,判断该原始数据记录中是否包含反映用户做出特定隐私行为的敏感传感器数据;在判断出包含的情况下,利用中性数据进行对应局部替换得到脱敏数据记录,并将上述原始数据记录输入数据脱敏模型,得到脱敏处理结果;进一步地,一方面,基于该脱敏处理结果和该脱敏数据记录,确定脱敏处理损失,另一方面,将该脱敏处理结果输入预先训练的业务预测模型中,得到业务预测结果,并结合上述业务标签确定业务预测损失;进而基于脱敏处理损失和业务预测损失,训练数据脱敏模型。
-
公开(公告)号:CN111475852B
公开(公告)日:2020-09-15
申请号:CN202010567562.X
申请日:2020-06-19
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于隐私保护针对业务模型进行数据预处理的方法,在对业务模型进行数据预处理过程中,从各个业务方接收扰动后的隐私数据,并基于隐私数据统一训练业务模型,从而向各个业务方提供训练好的业务模型。其中,各个业务方对隐私数据进行扰动过程中,采用预先确定分布的扰动数据,并利用这种分布一致的扰动数据可以由一份通用扰动数据代替的特性,将样本距离近似为通用扰动数据的数值计算。基于这种原理计算损失,并采取特定的技术特征,使得各个业务方在基于隐私保护的业务模型的数据预处理过程中,减少通信量以及计算量,提高数据处理效率。
-
公开(公告)号:CN111382846B
公开(公告)日:2020-09-01
申请号:CN202010466496.7
申请日:2020-05-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于迁移学习的训练神经网络模型的方法和装置,方法包括:第一神经网络模型包括第一私有层、第二私有层、第一共享层、第二共享层和第一融合层,第一融合层接收第一私有层的输出和第一共享层的输出,得到第一融合结果和第二融合结果,将第一融合结果输出给第二私有层,将第二融合结果输出给第二共享层;第二神经网络模型包括第三私有层、第四私有层、第一共享层、第二共享层和第二融合层,第二融合层接收第三私有层的输出和第一共享层的输出,得到第三融合结果和第四融合结果,将第三融合结果输出给第四私有层,将第四融合结果输出给第二共享层。能够提升模型的泛化性。
-
公开(公告)号:CN111340242A
公开(公告)日:2020-06-26
申请号:CN202010409990.X
申请日:2020-05-15
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种保护隐私的模型联合训练方及装置,在联合训练方法中,服务端发布模型训练任务。接收若干终端设备发送的参与请求。根据参与请求,查询贡献值列表,以获取若干终端设备各自的累计贡献值。基于查询得到的累计贡献值,从若干终端设备中选取各目标终端设备,并将初始模型拆分为对应于各目标终端设备的多个子模型。向各目标终端设备发送联合训练请求。该联合训练请求用于指示各目标终端设备,基于各自维护的、符合上述描述信息中至少部分描述信息的私有样本,在本地训练对应子模型。接收各目标终端设备发送的训练结果。根据各目标终端设备的训练结果,更新贡献值列表以及更新初始模型,得到联合训练后的目标模型。
-
公开(公告)号:CN111339432A
公开(公告)日:2020-06-26
申请号:CN202010411098.5
申请日:2020-05-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06Q30/02
Abstract: 本说明书提出了一种电子对象的推荐方法、装置和电子设备,其中,所述电子对象的推荐方法包括:获取已为第一用户推荐的多个电子对象的特征,根据所述多个电子对象的特征生成特征序列;根据所述特征序列确定第一用户对电子对象特定要素的偏好值,之后根据所述第一用户的用户特征和所述第一用户对电子对象特定要素的偏好值,从候选电子对象中确定向第一用户推荐的电子对象。基于本说明书的电子对象推荐方案能够提高电子对象推荐的匹配度。
-
公开(公告)号:CN111291895A
公开(公告)日:2020-06-16
申请号:CN202010054042.9
申请日:2020-01-17
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00
Abstract: 本说明书实施例提供一种组合特征评估模型的样本生成和训练方法及装置。在样本生成阶段,从第一样本包括M1维特征中选取待组合的多个特征维度,对于多个特征维度中的各个特征维度,根据N1个第一样本在该特征维度下的特征值分布,确定该特征维度的第一元特征;基于第一组合规则对N1个第一样本在多个特征维度下的特征值进行组合,得到第一组合特征;基于第一组合特征的特征值分布和N1个第一样本的第一标注数据,确定第一组合特征对提升业务预测模型预测效果的第一价值,并基于第一价值生成第二标注数据,通过多个特征维度各自的第一元特征、第一组合规则和第二标注数据,确定第二样本。在模型训练阶段,使用第二样本对组合特征评估模型进行训练。
-
公开(公告)号:CN111291416A
公开(公告)日:2020-06-16
申请号:CN202010384190.7
申请日:2020-05-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于隐私保护对业务模型进行数据预处理的方法,在对业务模型进行数据预处理过程中,通过将业务模型的前半部分设置在可信的第一环境中,可以有效保护数据隐私。同时由于可信环境中的数据处理速度变慢,结合设置在第二环境中的第二部分,可以进行模型训练过程加速,提高数据处理效率。进一步地,通过第一部分和第二部分的动态切分,可以保证第一部分的处理结果有效保护数据隐私。总之,本说明书实施例描述的技术方案可以提高基于隐私保护的数据预处理过程的有效性。
-
-
-
-
-
-
-
-