-
公开(公告)号:CN117743856A
公开(公告)日:2024-03-22
申请号:CN202311845208.9
申请日:2023-12-28
申请人: 清华大学 , 支付宝(杭州)信息技术有限公司
IPC分类号: G06F18/214 , G06F18/2415 , G06F18/243 , G06N20/00 , G06Q20/40
摘要: 本说明书实施例涉及一种训练风险识别模型的方法及装置,方法包括:首先,获取有硬标签的第一样本集,以及无标签的第二样本集,任一样本集包括交易样本,硬标签指示交易是否为风险交易。然后,基于插值法对第一样本集进行样本增强,并使用增强后的第一样本集训练得到第一模型。接下来,将第一样本集和第二样本集构成的样本总集中的各个交易样本输入到第一模型中,得到关于风险预测的软标签。最后,将第一样本集中的交易样本输入到第二模型中,基于硬标签确定第一损失;将样本总集中的交易样本输入到第二模型中,基于软标签确定第二损失;基于第一损失和第二损失所确定的总预测损失,对第二模型进行训练,第二模型用于预测交易是否为风险交易。
-
公开(公告)号:CN118114042A
公开(公告)日:2024-05-31
申请号:CN202410141534.X
申请日:2024-01-31
申请人: 支付宝(杭州)信息技术有限公司
IPC分类号: G06F18/214 , G06F18/213 , G06F40/30 , G06N20/00 , G06Q20/40
摘要: 本说明书公开了一种模型训练的方法、装置、存储介质和电子设备,所述方法包括:针对确定出的每一个样本交易数据,确定该样本交易数据的属性描述为浅层文本,确定该样本交易数据的风险描述为深层文本。将该样本交易数据输入待训练的风险识别模型,得到该样本交易数据的浅特征和深特征。将浅层文本输入文本识别模型,得到第一特征,将深层文本输入文本识别模型,确定第二特征。根据该样本交易数据的第一特征、该样本交易数据的浅特征、该样本交易数据的第二特征以及该样本交易数据的深特征,对待训练的风险识别模型进行训练。通过第一特征以及第二特征,指导风险识别模型对各样本交易数据进行特征提取,更好地表征用户存在的风险,提高准确性。
-
公开(公告)号:CN114092097B
公开(公告)日:2024-05-24
申请号:CN202111396497.X
申请日:2021-11-23
申请人: 支付宝(杭州)信息技术有限公司
摘要: 本说明书一个或多个实施例涉及数据处理技术领域,尤其涉及一种风险识别模型的训练方法、交易风险确定方法及装置。该方法包括:获取训练样本,训练样本包括第一交易的意愿标签、风险标签以及多个特征;将多个特征输入风险识别模型进行预测处理,预测处理包括,在特征处理网络,对多个特征进行特征交叉处理,得到表征向量;在第一识别层,基于对表征向量的第一处理结果,确定第一交易的意愿度;在第二识别层,基于对表征向量的第二处理结果,确定第一交易的风险度;在预测损失减小的方向,更新风险识别模型的参数,其中预测损失包括第一损失和第二损失,第一损失基于意愿度和意愿标签确定,第二损失基于风险度和风险标签确定。
-
公开(公告)号:CN117787443A
公开(公告)日:2024-03-29
申请号:CN202311868400.X
申请日:2023-12-29
申请人: 支付宝(杭州)信息技术有限公司
IPC分类号: G06N20/00 , G06N5/04 , G06F40/186
摘要: 本说明书公开了一种风控方法、装置、设备及可读存储介质,根据用于描述用户事件中各用户行为的描述文本确定的参考文本序列作为训练样本,对预训练的自然语言模型进行微调,得到行为序列生成模型,根据行为序列生成模型和提示文本,得到目标文本序列,以目标文本序列为对抗样本,对风控模型进行优化,通过优化后的风控模型进行风控。可见,通过上述方案,无需与风控模型反复交互就得到行为序列生成模型生成的对抗样本,低成本、高效地提高了风控模型的鲁棒性和精度,并且,在预训练的自然语言模型的基础上微调得到的行为序列生成模型,能够适用于以用户行为作为训练样本的多个不同的风控模型,提高了风控模型的优化效率以及隐私数据的安全性。
-
公开(公告)号:CN116049761A
公开(公告)日:2023-05-02
申请号:CN202211734588.4
申请日:2022-12-30
申请人: 支付宝(杭州)信息技术有限公司
IPC分类号: G06F18/25 , G06F18/2413 , G06F18/2433 , G06F18/2451 , G06F18/241 , G06N3/08 , G06F16/2457
摘要: 本说明书实施例提供了一种数据处理方法、装置及设备,其中,该方法包括:获取与执行目标业务相关的目标数据;基于预先训练的风险检测模型和预设检索数据库,对所述目标数据进行匹配检测处理,得到所述预设检索库中与所述目标数据具有相关关系的候选数据,并基于所述候选数据对应的风险类型,确定所述目标数据对应的风险类型;基于所述候选数据及对应的风险类型,对预设线性模型进行训练,得到训练后的线性模型,并基于所述训练后的线性模型每一维的模型参数,确定所述目标数据每一维度的特征的重要性;基于所述目标数据对应的风险类型和所述目标数据每一维度的特征的重要性,确定执行所述目标业务是否存在风险。
-
公开(公告)号:CN115983858A
公开(公告)日:2023-04-18
申请号:CN202211675809.5
申请日:2022-12-26
申请人: 支付宝(杭州)信息技术有限公司
摘要: 本说明书实施例公开了一种模型的处理、风险防控的处理方法、装置及设备,该模型的处理方法包括:获取应用于元学习的样本数据,该样本数据中包括对应事件的特征、样本标签信息和支撑集,支撑集中包括多个不同的事件类别,以及每个事件类别对应的支撑样本数据;基于样本数据、支撑集中不同事件类别的支撑样本数据对应的注意力权重和支撑集中不同事件类别包含的支撑样本数据的数量,确定支撑集中不同事件类别对应的第一类别中心,并基于样本数据,确定支撑集中不同事件类别对应的特征的均值作为不同事件类别对应的第二类别中心;基于第一类别中心、第二类别中心和样本数据对应用于可信场景中的目标模型进行模型训练,得到训练后的目标模型。
-
公开(公告)号:CN114912549B
公开(公告)日:2022-12-13
申请号:CN202210807503.4
申请日:2022-07-11
申请人: 支付宝(杭州)信息技术有限公司
摘要: 本说明书实施例描述了风险交易识别模型的训练方法、风险交易识别方法和装置。根据实施例的方法,在对风险交易识别模型进行训练时,获取到的黑数据样本和白数据样本的分类标签是已知的。通过利用当前训练的风险交易识别模型对各数据样本进行识别能够得到各自的识别结果,进而可以确定出损失函数,并利用该损失函数继续进行模型训练。由于确定的损失函数是能够提高黑数据样本的学习权重的,从而当用于模型学习的黑数据样本少于白数据样本时,能够减弱学习任务向白数据样本的分类标签倾斜的问题,进而提高模型对风险交易进行识别的准确性。
-
公开(公告)号:CN110879865B
公开(公告)日:2022-08-12
申请号:CN201911052966.9
申请日:2019-10-31
申请人: 支付宝(杭州)信息技术有限公司
IPC分类号: G06F16/9535 , G06F16/9538 , G06N3/08 , G06F21/31
摘要: 本说明书实施例公开了核身产品的推荐方法和装置。本说明的一个实施例公开的方法,包括:将用户的属性特征分别输入至迭代前和迭代后的第一推荐模型中,以确定多个核身产品对于用户的第一推荐值和第二推荐值,根据第一推荐值和第二推荐值确定最终推荐值,根据最终推荐值向用户推荐至少一种核身产品;第一推荐模型为强化学习模型。
-
公开(公告)号:CN112149824B
公开(公告)日:2022-07-22
申请号:CN202010968311.2
申请日:2020-09-15
申请人: 支付宝(杭州)信息技术有限公司
摘要: 本说明书实施例提供一种更新推荐模型的方法和装置,其中推荐模型包括通过强化学习实现的智能体。方法包括:获取针对目标用户的当前推荐状态,将其输入智能体,智能体根据推荐策略,从备选动作集中确定针对目标用户的推荐动作。其中,推荐策略通过策略参数进行表征。然后,确定在执行上述推荐动作的情况下,按照推荐策略进行推荐的期望收益,作为第一收益;确定在推荐策略下,执行所有备选动作的预期平均收益,作为第二收益;并且,基于第一收益与第二收益的差值,确定执行推荐动作的遗憾度表示。根据上述遗憾度表示,确定对策略参数的更新梯度;于是根据更新梯度,更新智能体中的推荐策略。
-
公开(公告)号:CN114692892A
公开(公告)日:2022-07-01
申请号:CN202210285951.2
申请日:2022-03-23
申请人: 支付宝(杭州)信息技术有限公司
摘要: 本说明书实施例描述了对数值特征进行处理的方法、模型训练方法和装置。根据实施例的方法,考虑对数值特征进行二进制编码,然后根据得到的二进制数值特征中的值可以确定出特征矩阵。如此实现了对数值特征可能值都进行了编码,能够降低特征信息损失的可能。进一步,对得到的特征矩阵进行数据域覆盖,能够使得利用该数值特征训练得到的模型在预测应用时,对未参与模型训练的数值输入值也能具有较好的输出。
-
-
-
-
-
-
-
-
-