-
公开(公告)号:CN111046380A
公开(公告)日:2020-04-21
申请号:CN201911273855.0
申请日:2019-12-12
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本申请实施例公开了一种基于对抗样本增强模型抗攻击能力的方法和系统。所述方法包括:获取目标样本;将所述目标样本输入第一模型,得到对应于所述目标样本的输出;调整所述目标样本,以降低所述目标样本的所述输出中的前N个最大的输出值,其中,所述N是正整数,所述输出值用于表征所述目标样本属于所述输出值对应类别的概率;在所述输出满足预设条件时,将调整后的所述目标样本作为对抗样本;基于该对抗样本,调整第二模型,以增强所述第二模型的抗攻击能力。其中,第二模型可以为用于对理赔证据图片进行识别的神经网络模型,理赔证据图片包括理赔者的个人信息图片以及理赔商品的图片。
-
公开(公告)号:CN119538984A
公开(公告)日:2025-02-28
申请号:CN202411659120.2
申请日:2024-11-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/0455 , G06N5/022 , G06N5/04 , G06N3/0895
Abstract: 本说明书提供一种网络模型的训练方法、推荐方法、系统,训练方法包括:获得样本数据集,基于大语言模型获得样本数据集对应的第一预测推荐结果,基于大语言模型和推荐模型获得样本数据集对应的第二预测推荐结果,以最小化第一预测推荐结果与预设第一标签之间的第一损失函数、第二预测推荐结果与预设第二标签之间的第二损失函数为训练目标更新所述预设网络的参数,得到目标网络模型,其中,预设第一标签为基于样本用户的丰富意图确定的。通过采用丰富意图确定大语言模型的预设第一标签,可以训练大语言模型辨别样本用户更深层次的用户意图的能力,从而使得训练得到的目标网络模型能够准确有效地为用户做推荐。
-
公开(公告)号:CN117010492A
公开(公告)日:2023-11-07
申请号:CN202310980538.2
申请日:2023-08-04
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N5/02 , G06N3/08 , G06F16/9535 , G06Q30/0601
Abstract: 本说明书实施例提供了基于知识迁移进行模型训练的方法及装置。在该方法中,可以获取不同场景的场景数据;然后根据所获取的场景数据学习各个场景之间的关联性,以得到各个场景对应的迁移权重,其中,每个场景对应的迁移权重用于表征该场景与其他场景之间的关联性特征;以及利用知识蒸馏根据各个场景对应的迁移权重在由场景数据训练得到的通用模型与各个场景对应的子模型之间进行知识迁移,以得到各个场景的子模型。
-
公开(公告)号:CN116187411A
公开(公告)日:2023-05-30
申请号:CN202211621862.7
申请日:2022-12-16
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种基于元学习的模型训练方法、推荐方法和装置。所述基于元学习的模型训练方法包括:获取多个第一训练数据,所述第一训练数据包括第一产品数据、第一用户数据和第一标签,所述第一标签用于表示第一产品数据与第一用户数据是否关联;通过分析第一训练数据之间的相似性,构建多个训练任务;根据所述多个训练任务进行元学习,得到元模型;根据第二训练数据训练所述元模型,得到业务模型,所述第二训练数据包括第二产品数据、第二用户数据和第二标签,所述第二标签用于表示第二产品数据与第二用户数据是否关联,所述业务模型用于对产品数据与用户数据相关联的可能性进行预测。本说明书实施例可以提高元学习的效果。
-
公开(公告)号:CN115169583A
公开(公告)日:2022-10-11
申请号:CN202210820927.4
申请日:2022-07-13
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种用户行为预测系统的训练方法及装置,一种用户行为预测方法及装置。其中训练方法包括:获取多个训练样本,其中各个训练样本包括对应用户的用户特征,对应业务对象的对象标识和对象属性数据,以及指示所述用户是否对所述业务对象作出预定行为的行为标签;基于所述对象标识和行为标签,确定所述业务对象的嵌入向量标签;基于所述对象属性数据和嵌入向量标签,训练对象嵌入模型;将所述对象属性数据输入训练好的对象嵌入模型,得到第一预测嵌入向量;基于所述第一预测嵌入向量、用户特征和行为标签,训练第一行为预测模型。由此,训练好的第一行为预测模型和训练好的对象嵌入模型构成训练好的用户行为预测系统。
-
公开(公告)号:CN111046380B
公开(公告)日:2022-02-15
申请号:CN201911273855.0
申请日:2019-12-12
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本申请实施例公开了一种基于对抗样本增强模型抗攻击能力的方法和系统。所述方法包括:获取目标样本;将所述目标样本输入第一模型,得到对应于所述目标样本的输出;调整所述目标样本,以降低所述目标样本的所述输出中的前N个最大的输出值,其中,所述N是正整数,所述输出值用于表征所述目标样本属于所述输出值对应类别的概率;在所述输出满足预设条件时,将调整后的所述目标样本作为对抗样本;基于该对抗样本,调整第二模型,以增强所述第二模型的抗攻击能力。其中,第二模型可以为用于对理赔证据图片进行识别的神经网络模型,理赔证据图片包括理赔者的个人信息图片以及理赔商品的图片。
-
公开(公告)号:CN110941824B
公开(公告)日:2022-01-28
申请号:CN201911274700.9
申请日:2019-12-12
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本申请实施例公开了一种基于对抗样本增强模型抗攻击能力的方法和系统。所述方法包括:获取第一样本和第二样本,其中,所述第一样本与所述第二样本的相似度大于相似度阈值;将所述第一样本和所述第二样本输入第一模型,得到与所述第一样本对应的第一输出,以及与所述第二样本对应的第二输出;基于所述第一输出与所述第二输出的差异程度,调整所述第二样本,以增大所述差异程度,并在所述差异程度满足预设条件时,将调整后的所述第二样本作为对抗样本;基于该对抗样本,调整第二模型,以增强所述第二模型的抗攻击能力。其中,第二模型可以为用于对理赔证据图片进行识别的神经网络模型,理赔证据图片包括理赔者的个人信息图片。
-
公开(公告)号:CN113222073A
公开(公告)日:2021-08-06
申请号:CN202110650697.7
申请日:2021-06-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本公开披露了一种训练迁移学习模型和推荐模型的方法和装置。所述方法包括:对源域样本和目标域样本进行聚类,得到聚类结果;根据所述聚类结果确定所述源域样本的权值,所述源域样本的权值用于表征所述源域样本与所述目标域样本的相似度;根据所述源域样本的权值从所述源域样本中确定所述目标域样本的相似样本,以形成包含所述相似样本和所述目标域样本的训练样本;根据所述训练样本训练所述迁移学习模型。
-
公开(公告)号:CN111027717A
公开(公告)日:2020-04-17
申请号:CN201911266382.1
申请日:2019-12-11
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/10
Abstract: 本说明书实施例公开了一种模型训练方法。所述方法包括:获取训练样本;使用所述训练样本,所述训练样本为样本图像、样本文本或样本语音,通过随机梯度朗之万动力学算法对初始模型进行多轮训练,得到目标模型,所述目标模型为图像分类模型、文本分类模型或语音分类模型,其中,所述多轮训练包括:基于所述训练样本,确定模型参数对应的梯度下降值;向所述梯度下降值添加随机噪声;判断本轮训练中所述随机梯度朗之万动力学算法是否进入朗之万动力学状态;当未进入朗之万动力学状态,基于所述添加了随机噪声后的梯度下降值,优化模型参数,进行下一轮训练;当进入朗之万动力学状态,从模型参数的后验概率分布中采样模型参数,确定所述目标模型。
-
公开(公告)号:CN110941824A
公开(公告)日:2020-03-31
申请号:CN201911274700.9
申请日:2019-12-12
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本申请实施例公开了一种基于对抗样本增强模型抗攻击能力的方法和系统。所述方法包括:获取第一样本和第二样本,其中,所述第一样本与所述第二样本的相似度大于相似度阈值;将所述第一样本和所述第二样本输入第一模型,得到与所述第一样本对应的第一输出,以及与所述第二样本对应的第二输出;基于所述第一输出与所述第二输出的差异程度,调整所述第二样本,以增大所述差异程度,并在所述差异程度满足预设条件时,将调整后的所述第二样本作为对抗样本;基于该对抗样本,调整第二模型,以增强所述第二模型的抗攻击能力。其中,第二模型可以为用于对理赔证据图片进行识别的神经网络模型,理赔证据图片包括理赔者的个人信息图片。
-
-
-
-
-
-
-
-
-