-
公开(公告)号:CN111445282B
公开(公告)日:2023-02-10
申请号:CN202010203021.9
申请日:2020-03-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q30/02 , G06F16/9535
Abstract: 本说明书一个或多个实施例提供了一种基于用户行为的业务处理方法、装置及设备,在基于用户行为的业务处理方法中,分别对第一用户行为特征向量和第一广告特征向量进行压缩后,将得到的第二用户行为特征向量以及第二广告特征向量进行特征交叉,得到注意力机制参数,再将该注意力机制参数与第一用户行为特征向量进行特征交叉,得到用户行为的向量表示,从而可根据用户的行为充分学习到用户对每个广告的差别,有助于更好的挖掘用户的兴趣的多样性。
-
公开(公告)号:CN115034333A
公开(公告)日:2022-09-09
申请号:CN202210759145.4
申请日:2022-06-29
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供用于经由至少两个第一成员设备和第二成员设备训练业务模型的联邦学习方法,联邦学习装置和联邦学习系统。各个第一成员设备具有本地数据,第二成员设备维护待训练的业务模型。在进行联邦学习时,在各个第一成员设备从第二成员设备接收当前业务模型后,各个第一成员设备使用本地数据训练所接收的当前业务模型,确定本地训练出的业务模型与所接收的业务模型之间的模型相关性,并且仅仅在模型相关性满足预定条件时才将本地训练出的模型更新量提供给第二成员设备。第二成员设备根据从各个第一成员设备接收的模型更新量更新业务模型。
-
公开(公告)号:CN115034330A
公开(公告)日:2022-09-09
申请号:CN202210741054.8
申请日:2022-06-27
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了基于样本特征的有向关联关系的随机森林训练方法及随机森林训练装置。在该随机森林训练方法中,基于经过打标的多个训练样本进行针对样本特征的结构学习,得到由该多个训练样本的样本特征以及样本标记作为节点构成的DAG;根据DAG中的样本标记节点从DAG中抽取由样本特征节点构成的有向关联路径,该有向关联路径中的各个样本特征节点按序有向连接;基于所抽取的有向关联路径来训练决策树;以及基于训练得到的决策树构建随机森林。
-
公开(公告)号:CN114880473A
公开(公告)日:2022-08-09
申请号:CN202210468316.8
申请日:2022-04-29
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书公开了一种标签分类方法、装置、存储介质及电子设备,其中,方法包括:获取项目标签矩阵,所述项目标签矩阵包括多个项目、多个标签以及各个项目与各个标签之间的对应关系,基于所述项目标签矩阵中的所有标签获取标签嵌入向量集合,基于双曲空间模型,采用所述项目标签矩阵和所述标签嵌入向量集合,对所述所有标签进行层级分类处理,以得到标签分类函数。
-
公开(公告)号:CN113313208A
公开(公告)日:2021-08-27
申请号:CN202110714723.8
申请日:2021-02-05
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书涉及一种对象聚类方法和系统,在该方法包括基于多个对象及对象间的关联关系构造图数据;其中,所述图数据包括多个节点以及节点间的边权信息;对图神经网络模型进行一轮或多轮迭代更新,并将最后一轮迭代更新获得的图数据的节点类簇作为节点聚类结果,进而基于节点聚类结果确定对象聚类结果,其中一轮迭代更新包括:利用图神经网络模型处理图数据,得到各节点的嵌入向量,以及基于各节点的嵌入向量确定的节点间的边权预测信息;利用聚类算法处理各节点的嵌入向量,得到一个或多个类簇;确定每个类簇的中心点的嵌入向量,并计算各节点与其所在类簇的中心点的距离;调整所述图神经网络模型的模型参数。
-
公开(公告)号:CN111737719B
公开(公告)日:2020-11-24
申请号:CN202010691952.8
申请日:2020-07-17
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种保护隐私的文本分类方法及装置,在文本分类方法中,第一服务器接收数据请求方发送的文本分类请求,文本分类请求至少包括采用数据请求方的第一公钥进行加密的待分类文本。基于数据提供方提供的加密样本文本,构建词组集合。该加密样本文本采用第一公钥对样本文本加密得到。确定加密词频,该加密词频为词组集合中各词组在加密的待分类文本中的词频统计的加密值。至少向第二服务器发送加密词频,以使得第二服务器将加密词频加载到其可信执行环境TEE中,在TEE中,对加密词频进行解密,并将解密结果输入预先部署在TEE中的文本分类模型,得到待分类文本的分类结果,其中的文本分类模型基于上述样本文本训练得到。
-
公开(公告)号:CN111368337B
公开(公告)日:2020-09-08
申请号:CN202010459358.6
申请日:2020-05-27
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种保护隐私的样本生成模型构建、仿真样本生成方法及装置,在样本生成模型构建方法中,对真实样本集中多个真实样本进行聚类,确定N个类簇。对于N个类簇中任意的第一类簇,基于归属于第一类簇的各真实样本,训练对应于第一类簇的、具有差分隐私功能的子生成模型。基于N个类簇分别对应的N个子生成模型,形成样本生成模型。该样本生成模型用于基于原始样本生成对应的仿真样本。
-
公开(公告)号:CN111325417B
公开(公告)日:2020-08-25
申请号:CN202010409988.2
申请日:2020-05-15
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种实现隐私保护的多方协同更新业务预测模型的方法,其中多方包括服务器和多个数据方,该服务器部署针对业务对象的业务预测模型,该方法包括对业务预测模型进行任一轮迭代更新,具体包括:参与本轮迭代更新的第一数据方,从服务器获取第一当前参数部分,该第一当前参数部分是基于业务预测模型的当前模型参数进行随机选取而得到;第一数据方利用本地训练数据,更新上述第一当前参数部分,基于更新后参数的至少一部分,得到第一更新参数部分;第一数据方将该第一更新参数部分上传至服务器;服务器根据该第一更新参数部分,以及从参与本轮迭代更新的其他数据方接收的其他更新参数部分,更新业务预测模型。
-
公开(公告)号:CN111340242B
公开(公告)日:2020-08-04
申请号:CN202010409990.X
申请日:2020-05-15
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种保护隐私的模型联合训练方及装置,在联合训练方法中,服务端发布模型训练任务。接收若干终端设备发送的参与请求。根据参与请求,查询贡献值列表,以获取若干终端设备各自的累计贡献值。基于查询得到的累计贡献值,从若干终端设备中选取各目标终端设备,并将初始模型拆分为对应于各目标终端设备的多个子模型。向各目标终端设备发送联合训练请求。该联合训练请求用于指示各目标终端设备,基于各自维护的、符合上述描述信息中至少部分描述信息的私有样本,在本地训练对应子模型。接收各目标终端设备发送的训练结果。根据各目标终端设备的训练结果,更新贡献值列表以及更新初始模型,得到联合训练后的目标模型。
-
公开(公告)号:CN111475855A
公开(公告)日:2020-07-31
申请号:CN202010590733.0
申请日:2020-06-24
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/62
Abstract: 本说明书实施例提供一种实现隐私保护的数据处理方法,包括:先获取多个终端传感器采集到的多条原始传感器数据,构成原始数据记录,以及获取对应的针对用户的业务标签;然后,判断该原始数据记录中是否包含反映用户做出特定隐私行为的敏感传感器数据;在判断出包含的情况下,利用中性数据进行对应局部替换得到脱敏数据记录,并将上述原始数据记录输入数据脱敏模型,得到脱敏处理结果;进一步地,一方面,基于该脱敏处理结果和该脱敏数据记录,确定脱敏处理损失,另一方面,将该脱敏处理结果输入预先训练的业务预测模型中,得到业务预测结果,并结合上述业务标签确定业务预测损失;进而基于脱敏处理损失和业务预测损失,训练数据脱敏模型。
-
-
-
-
-
-
-
-
-