-
公开(公告)号:CN111291416B
公开(公告)日:2020-07-31
申请号:CN202010384190.7
申请日:2020-05-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于隐私保护对业务模型进行数据预处理的方法,在对业务模型进行数据预处理过程中,通过将业务模型的前半部分设置在可信的第一环境中,可以有效保护数据隐私。同时由于可信环境中的数据处理速度变慢,结合设置在第二环境中的第二部分,可以进行模型训练过程加速,提高数据处理效率。进一步地,通过第一部分和第二部分的动态切分,可以保证第一部分的处理结果有效保护数据隐私。总之,本说明书实施例描述的技术方案可以提高基于隐私保护的数据预处理过程的有效性。
-
公开(公告)号:CN111382846A
公开(公告)日:2020-07-07
申请号:CN202010466496.7
申请日:2020-05-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于迁移学习的训练神经网络模型的方法和装置,方法包括:第一神经网络模型包括第一私有层、第二私有层、第一共享层、第二共享层和第一融合层,第一融合层接收第一私有层的输出和第一共享层的输出,得到第一融合结果和第二融合结果,将第一融合结果输出给第二私有层,将第二融合结果输出给第二共享层;第二神经网络模型包括第三私有层、第四私有层、第一共享层、第二共享层和第二融合层,第二融合层接收第三私有层的输出和第一共享层的输出,得到第三融合结果和第四融合结果,将第三融合结果输出给第四私有层,将第四融合结果输出给第二共享层。能够提升模型的泛化性。
-
公开(公告)号:CN111325417A
公开(公告)日:2020-06-23
申请号:CN202010409988.2
申请日:2020-05-15
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种实现隐私保护的多方协同更新业务预测模型的方法,其中多方包括服务器和多个数据方,该服务器部署针对业务对象的业务预测模型,该方法包括对业务预测模型进行任一轮迭代更新,具体包括:参与本轮迭代更新的第一数据方,从服务器获取第一当前参数部分,该第一当前参数部分是基于业务预测模型的当前模型参数进行随机选取而得到;第一数据方利用本地训练数据,更新上述第一当前参数部分,基于更新后参数的至少一部分,得到第一更新参数部分;第一数据方将该第一更新参数部分上传至服务器;服务器根据该第一更新参数部分,以及从参与本轮迭代更新的其他数据方接收的其他更新参数部分,更新业务预测模型。
-
公开(公告)号:CN110796268A
公开(公告)日:2020-02-14
申请号:CN202010007914.6
申请日:2020-01-06
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00
Abstract: 本说明书实施例提供了一种确定业务处理模型超参数的方法和装置,所述方法包括:基于多个超参数的当前取值空间,获取预定数目个超参数组合;获取业务处理模型的训练样本集和测试样本集;获取与各个超参数组合对应的业务处理模型的性能值;从所述预定数目个超参数组合中确定第一正组合和多个负组合;基于所述第一正组合和多个负组合各自的超参数值,更新所述多个超参数的取值空间,以使得所述多个超参数的更新取值空间中包括所述第一正组合、且不包括所述多个负组合,所述多个超参数的更新取值空间用于确定所述业务处理模型的超参数取值。
-
公开(公告)号:CN118917379A
公开(公告)日:2024-11-08
申请号:CN202410918883.8
申请日:2024-07-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例提供一种针对多塔神经网络的模型训练方法及装置,包括:基于获取的样本集以及样本集中每个样本所对应的多源噪声标记组,通过第一损失函数对多塔神经网络进行第一阶段训练;确定每一样本分别对应于各个标记源视角的多源聚合输出概率;基于由第一损失函数与第二损失函数构建的目标损失函数对多塔神经网络进行第二阶段训练;第二损失函数为多塔神经网络在每一标记源视角下分别对样本集中的每一样本输出的概率值与相应样本对应于相应标记源视角的多源聚合输出概率之间的损失的加权平均值,任一标记源视角下对任一样本对应的损失的权重与多塔神经网络在该标记源视角下对该样本的认知的可靠程度呈负相关。
-
公开(公告)号:CN118626853A
公开(公告)日:2024-09-10
申请号:CN202410763384.6
申请日:2024-06-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F18/213 , G06N3/0455
Abstract: 本说明书一个或多个实施例公开了一种文本分析模型的训练方法、文本分析方法及装置。文本分析模型的训练方法包括:获取第一样本数据集合和第二样本数据集合,第一样本数据集合包括第一样本文本和第一标签信息,第二样本数据集合包括第二样本文本和第二标签信息。在编码器的参数固定的情况下,将第一样本数据集合输入基座模型,对第一样本文本进行文本分析,得到第一分析结果。然后,根据第一分析结果和第一标签信息对待训练的适配器的参数进行调整,得到训练后的适配器。在训练后的适配器的参数固定的情况下,将第二样本数据集合输入基座模型,对第二样本文本进行文本分析,得到第二分析结果。之后,根据第二分析结果和第二标签信息对编码器的参数进行调整,得到目标文本分析模型。
-
公开(公告)号:CN118427615A
公开(公告)日:2024-08-02
申请号:CN202410526264.4
申请日:2024-04-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F18/2431 , G06F16/9536 , G06F16/9537 , G06Q30/0251 , G06Q30/0601 , H04L67/306 , H04L67/55
Abstract: 本说明书实施例提供一种预测模型的训练方法及装置。该训练方法包括:首先,获取若干真实样本,其中各个真实样本的特征包括用户和对象的真实组合,对应的真实标签指示该真实组合中用户与对象的真实交互;接着,构造若干虚构样本,其中各个虚构样本的特征包括用户和对象的假定组合,对应的伪标签指示该假定组合中用户与对象的预期交互;其中至少一部分虚构样本的伪标签基于预定规则而确定,所述预定规则符合交互概率与用户或对象特征之间的单调性知识;然后,利用所述若干真实样本和若干虚构样本,更新当前预测模型。
-
公开(公告)号:CN117520961A
公开(公告)日:2024-02-06
申请号:CN202311498067.8
申请日:2023-11-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/243 , G06F18/213 , G06F18/25
Abstract: 本说明书实施例提供用于干预效应评估的树模型构建、干预效应评估方法、装置及系统。在树模型构建时,获取包括试验对象样本数据和观测对象样本数据的对象样本数据集,并且使用对象样本数据集来基于节点分裂构建效应评估树模型,在每次节点分裂时,以分裂损失值最小化为目标确定当前节点的目标节点分裂条件,当前节点的分裂损失值包括各个子节点处的经过数据融合后的无偏分裂损失值,各个子节点处的经过数据融合后的无偏分裂损失值根据试验对象样本数据所产生的无偏干预效应评估结果和数据融合因子确定,数据融合因子用于反映在与观测对象样本数据融合后所产生的试验对象样本数据的无偏干预效应评估结果在无偏分裂损失值确定时的缩放度。
-
公开(公告)号:CN117010992A
公开(公告)日:2023-11-07
申请号:CN202310959867.9
申请日:2023-08-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q30/0601 , G06Q30/0242 , G06F18/20 , G06F18/214 , G06F18/23 , G06N20/00
Abstract: 本说明书实施例公开了一种用于多任务多场景推荐的推荐模型的训练方法和推荐方法,涉及信息推荐模块,本说明书通过提供的推荐模型包括多个任务中各任务对应的场景网络,在向用户进行推荐时确定目标推荐内容对应的至少一个目标任务和目标场景,通过推荐模型包括的目标任务对应的场景网络中场景共有网络和目标场景专有网络,生成目标推荐内容。针对该推荐模型的训练,基于包括已标注的推荐内容的样本集合,首先对推荐模型包括的全部场景网络进行第一参数训练,其次对各任务对应的多个场景专有网络进行第二参数训练,最后对各任务对应的多个场景专有网络进行第三参数训练,直至推荐模型拟合,且第二参数训练和第三参数训练的训练方法不相同。
-
公开(公告)号:CN115861681A
公开(公告)日:2023-03-28
申请号:CN202211422452.X
申请日:2022-11-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/764 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/09
Abstract: 本说明书实施例公开了一种模型的元学习方法、装置以及设备。方案包括通过获取包含M个样本的集合;针对第i个样本Si,生成对应于所述训练样本的嵌入向量φi和中间特征图ηi;根据所产生的M个嵌入向量的平均值τc生成维度注意力图Md,和,根据所产生的M个中间特征图的平均值τη生成区域注意力图Mr;融合所述嵌入向量φi和维度注意力图Md生成维度特征向量φi’,以及,融合所述第i个样本的中间特征图ηi和所述区域注意力图Mr生成区域特征图ηi’;根据所述维度特征向量φi’和所述区域特征图ηi’进行训练。从而实现在元学习中,通过从维度和区域这两个不同的角度上来精确定位任务所需要的特征,减少无关特征的干扰。
-
-
-
-
-
-
-
-
-