-
公开(公告)号:CN117370652A
公开(公告)日:2024-01-09
申请号:CN202311303448.6
申请日:2023-10-08
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F18/214
Abstract: 本说明书的实施例提供了一种模型训练、信息推荐方法和装置。在该模型训练方法中,通过在训练过程中引入样本分组模型和权重计算模型,根据当前训练样本经过待优化模型的输出和对应的标签确定各个当前训练样本的状态。再分别利用样本分组模型和权重计算模型确定各个当前训练样本所属的分布类别和对应的权重。进而,基于当前训练样本经过待优化模型的输出和对应的标签以及对应的权重确定损失值,以调整待优化模型的模型参数;基于各个当前训练样本所属的分布类别和对应的权重确定相应的奖励值,以调整样本分组模型和权重计算模型的模型参数。
-
公开(公告)号:CN116128581A
公开(公告)日:2023-05-16
申请号:CN202211261153.2
申请日:2022-10-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q30/06 , G06V10/74 , G06V10/10 , G06V10/762
Abstract: 本说明书提供的物品推荐方法和系统,在获取目标物品的属性信息和用户交互信息后,在属性信息中提取出相似性特征,得到显式相似性特征,并基于用户交互信息,确定与目标物品相似的至少一个物品,以得到隐式相似性特征,以及基于显式相似性特征和隐式相似性特征,确定目标物品对应的推荐模型的初始化参数,并基于初始化参数,采用推荐模型对目标物品进行推荐;该方案可以提升在冷启动下物品推荐的准确率。
-
公开(公告)号:CN119166897A
公开(公告)日:2024-12-20
申请号:CN202411229706.5
申请日:2024-09-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06N3/0455 , G06N3/045 , G06N3/09 , G06F40/186 , G06F17/18
Abstract: 本说明书实施例提供了一种推荐系统的训练方法,在包含了排序模型与推荐模型的推荐系统中,排序模型的输出能够准确体现用户的偏好,对各个样本对象进行准确的偏好度排序。再以排序模型输出的排序信息作为监督信号训练推荐模型,在排序模型与推荐模型之间实现偏好对齐,减小、消除推荐模型中的流行度偏差。如此,提升推荐系统的推荐性能,可以为用户提供更加优质,准确的个性化推荐内容。
-
公开(公告)号:CN119829285A
公开(公告)日:2025-04-15
申请号:CN202411899717.4
申请日:2024-12-20
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书的实施例涉及用于确定模型训练的分片策略的方法和相关装置,模型可通过多种分片策略进行训练。该方法首先确定多个处理器在训练模型的过程中的运算时间,其中多个处理器可以根据分片策略进行划分,分片策略指示模型的数据在多个处理器中的划分方式。然后,基于分片策略,确定多个处理器在训练模型的过程中的通信时间。进一步,选择运算时间和通信时间中的较大者,并在该较大者满足时间条件时确定分片策略为多个分片策略中的目标分片策略。
-
公开(公告)号:CN111046394A
公开(公告)日:2020-04-21
申请号:CN201911289070.2
申请日:2019-12-12
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种基于对抗样本增强模型抗攻击能力的方法和系统,所述方法包括:获取目标样本的集合;将所述集合中的每一所述目标样本输入目标模型,得到与所述目标样本对应的第一输出;在所述第一输出大于或等于输出阈值时,将所述目标模型的所述第一输出对应的标签作为所述目标样本的目标标签;利用所述目标样本的集合和所述目标样本对应的所述目标标签训练替代模型;将候选样本输入所述替代模型,得到对应于所述候选样本的第二输出,并基于该第二输出调整所述候选样本以得到对抗样本;基于该对抗样本,调整所述目标模型。其中,目标模型可以为用于对图片进行识别的神经网络模型,所述图片包括个人信息图片。
-
公开(公告)号:CN118332339A
公开(公告)日:2024-07-12
申请号:CN202410502447.2
申请日:2024-04-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F18/22 , G06F40/284 , G06F40/30 , G06F40/289
Abstract: 本说明书实施例提供一种映射模型的训练方法及装置,该训练方法包括:首先,获取用户行为涉及的对象标识集,其中任一的目标对象标识关联描述目标对象的真实词元序列;接着,利用映射模型确定所述目标对象标识对应的目标表征向量及相关词元信息;然后,利用训练好的大语言模型处理所述目标表征向量,得到预测词元序列;之后,以所述预测词元序列趋同于所述真实词元序列为目标,训练所述映射模型。
-
公开(公告)号:CN117371517A
公开(公告)日:2024-01-09
申请号:CN202311367619.1
申请日:2023-10-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/0985 , G06N3/084 , G06F18/214 , G06V10/774 , G06T1/20
Abstract: 本说明书提供一种深度学习模型的元学习方法以及深度学习模型的元学习系统,涉及深度学习技术领域。该深度学习模型的元学习方法应用于包括N个处理节点的集群,其中,该方法包括:获得训练数据集,上述训练数据集包括多个任务对应的训练样本;以及,通过上述集群中的N个处理节点并行地基于上述训练数据集对上述深度学习模型进行多次迭代训练,得到该深度学习模型的元学习参数。其中,在每次迭代训练中,上述N个处理节点中的每个处理节点使用训练数据集中的部分训练样本学习该深度学习模型的部分参数,上述部分训练样本对应于同一任务。
-
公开(公告)号:CN116503134A
公开(公告)日:2023-07-28
申请号:CN202310467630.9
申请日:2023-04-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q30/0601 , G06N3/094 , G06N3/0475 , G06N3/045 , G06F18/214 , G06F18/2415
Abstract: 本说明书实施例提供一种用于生成商品表征的生成模型的训练方法及装置,在训练方法中,获取第一训练样本,其中至少包括商品标识和商品属性。分别确定商品标识和商品属性各自对应的第一原始向量和第二原始向量,并将其输入生成模型。其中,通过第一自编码器,确定商品标识的第一生成向量,通过第二自编码器,确定商品属性的第二生成向量。通过预训练的判别器,输出第二生成向量为真实的商品表征的预测概率。以减小第一损失为目标,调整判别器的参数,该第一损失正相关于预测概率。以减小第二损失为目标,调整第一自编码器和第二自编码器的参数,该第二损失正相关于基于第一原始向量和第一生成向量的比对确定的重构损失,负相关于第一损失。
-
公开(公告)号:CN116362809A
公开(公告)日:2023-06-30
申请号:CN202310455098.9
申请日:2023-04-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q30/0241 , G06Q30/0601 , G06F18/214 , G06F18/24
Abstract: 本说明书实施例提供一种商品推荐模型、推荐模型的训练方法及装置,在商品推荐模型的训练方法中,获取训练样本集。在嵌入层中,确定对各个训练样本中商品特征数据进行嵌入处理得到的特征矩阵。对各个训练样本对应的特征矩阵进行调整,其中包括,针对任意的第一训练样本对应的第一特征矩阵,确定各个特征维度的原始统计量。在以原始统计量为中心的目标分布中进行采样,以得到对应特征维度的更新统计量。至少基于各个特征维度的更新统计量,对第一特征矩阵进行调整,得到第一更新矩阵。在分类器层中,基于各个训练样本对应的更新矩阵,预测用户与对应商品进行预定交互行为的概率。基于各个训练样本的样本标签和概率,训练商品推荐模型。
-
公开(公告)号:CN113222073B
公开(公告)日:2023-04-07
申请号:CN202110650697.7
申请日:2021-06-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/23213 , G06N20/00
Abstract: 本公开披露了一种训练迁移学习模型和推荐模型的方法和装置。所述方法包括:对源域样本和目标域样本进行聚类,得到聚类结果;根据所述聚类结果确定所述源域样本的权值,所述源域样本的权值用于表征所述源域样本与所述目标域样本的相似度;根据所述源域样本的权值从所述源域样本中确定所述目标域样本的相似样本,以形成包含所述相似样本和所述目标域样本的训练样本;根据所述训练样本训练所述迁移学习模型。
-
-
-
-
-
-
-
-
-