-
公开(公告)号:CN115545124B
公开(公告)日:2023-04-18
申请号:CN202211507937.9
申请日:2022-11-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06N3/08
Abstract: 本说明书实施例提供了一种样本不平衡场景下的样本增量、模型训练方法及装置。其中,用户样本集包括高风险用户样本和低风险用户样本及其类别标签,高风险用户样本属于小样本。在该方法中,从用户样本集中按照不偏向高风险用户样本的方式确定观测用户样本,从用户样本集中按照偏向高风险用户样本的方式对样本抽样,得到抽样用户样本;基于风控场景中高风险用户数量小于低风险用户数量的风险用户特点,确定第一数量占比,以第一数量占比为平均值确定符合风险用户特点的第一概率分布,按照第一概率分布确定属于观测用户样本的第一因子。这样,基于第一因子、观测用户样本与抽样用户样本及其相应的样本标签,确定插值用户样本以及对应的插值标签。
-
公开(公告)号:CN114692724B
公开(公告)日:2023-03-28
申请号:CN202210208136.6
申请日:2022-03-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/2415 , G06F18/214 , G06N3/047 , G06N3/08
Abstract: 本说明书实施例描述了数据分类模型的训练方法、数据分类方法和装置。根据实施例的方法,首先获取标签已知的正数据样本和标签未知的灰度数据样本,然后分别确定基于该正数据样本的标准正数据概率分布和基于该灰度数据样本的拟合正数据概率分布。进一步即可根据该标准正数据概率分布和拟合正数据概率分布实现对数据分类模型的训练。如此基于灰度数据中的正数据也应服从标准正数据概率分布的原则,构建适用于对所有数据进行标签分类的数据分类模型,从而能够提高利用该数据分类模型对数据进行分类的准确性。
-
公开(公告)号:CN115600106A
公开(公告)日:2023-01-13
申请号:CN202211276933.4
申请日:2022-10-18
Applicant: 支付宝(杭州)信息技术有限公司(CN)
IPC: G06F18/214 , G06F18/24 , G06F18/22 , G06Q20/40
Abstract: 本说明书公开了一种风险识别模型的训练方法、装置、设备及存储介质,将训练样本输入待训练的风险识别模型,通过特征子网得到训练样本的第一特征,根据全连接层中的各参数对第一特征进行线性变换得到第二特征,通过分类子网得到训练样本的分类结果。以训练样本的标签以及分类结果之间的差异最小化,以及全连接层的各参数之间的相似性的最大化为训练目标,训练风险识别模型。可见,通过在训练目标中增加全连接层的各参数之间的相似性的最大化,能够使得训练后的风险识别模型不仅能够直接输出事件的风险类型,还可以通过表征子网输出的事件的特征适应于基于数据库的特征检索,扩展了风险识别的应用场景,提高了风险识别的准确性以及隐私的保护性。
-
公开(公告)号:CN114692724A
公开(公告)日:2022-07-01
申请号:CN202210208136.6
申请日:2022-03-03
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例描述了数据分类模型的训练方法、数据分类方法和装置。根据实施例的方法,首先获取标签已知的正数据样本和标签未知的灰度数据样本,然后分别确定基于该正数据样本的标准正数据概率分布和基于该灰度数据样本的拟合正数据概率分布。进一步即可根据该标准正数据概率分布和拟合正数据概率分布实现对数据分类模型的训练。如此基于灰度数据中的正数据也应服从标准正数据概率分布的原则,构建适用于对所有数据进行标签分类的数据分类模型,从而能够提高利用该数据分类模型对数据进行分类的准确性。
-
公开(公告)号:CN114092097A
公开(公告)日:2022-02-25
申请号:CN202111396497.X
申请日:2021-11-23
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例涉及数据处理技术领域,尤其涉及一种风险识别模型的训练方法、交易风险确定方法及装置。该方法包括:获取训练样本,训练样本包括第一交易的意愿标签、风险标签以及多个特征;将多个特征输入风险识别模型进行预测处理,预测处理包括,在特征处理网络,对多个特征进行特征交叉处理,得到表征向量;在第一识别层,基于对表征向量的第一处理结果,确定第一交易的意愿度;在第二识别层,基于对表征向量的第二处理结果,确定第一交易的风险度;在预测损失减小的方向,更新风险识别模型的参数,其中预测损失包括第一损失和第二损失,第一损失基于意愿度和意愿标签确定,第二损失基于风险度和风险标签确定。
-
公开(公告)号:CN111461223A
公开(公告)日:2020-07-28
申请号:CN202010251816.7
申请日:2020-04-01
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例提供了一种异常交易识别模型的训练方法及异常交易识别方法。在一种实施例中,一种异常交易识别模型的训练方法包括:首先,获取多个第一交易信息;其中,第一交易信息为第一交易的第一目标信息,第一交易包括成功历史交易和失败历史交易;然后,将每个第一交易信息输入预设异常交易识别模型,得到每个第一交易信息的第一预测值;其中,预设异常交易识别模型根据多个有标记的第二交易信息生成,第二交易信息为第二交易的第一目标信息,第二交易包括成功历史交易;最后,利用多个第一交易信息和每个第一交易信息的第一预测值训练目标识别模型,得到目标异常交易识别模型。
-
-
-
-
-