一种模型联合训练的方法和系统

    公开(公告)号:CN111523686A

    公开(公告)日:2020-08-11

    申请号:CN202010326265.6

    申请日:2020-04-23

    Abstract: 本说明书实施例公开了一种模型联合训练的方法及系统。所述方法包括:多个联合训练的参与终端分别基于所述终端自身持有的私有数据联合进行模型训练,多个联合训练的参与终端分别使用基于梯度的优化算法生成各自的梯度;所述多个参与终端分别将所述各自的梯度发送给服务器;所述服务器从多个所述梯度中选取可信任梯度,并且根据选取的所述可信任梯度更新所述联合训练模型的参数;所述样本数据为文本数据、语音数据或者图形数据。

    基于隐私保护确定相同业务数据的方法及装置

    公开(公告)号:CN111460510A

    公开(公告)日:2020-07-28

    申请号:CN202010302518.6

    申请日:2020-04-17

    Inventor: 陈超超 王力 周俊

    Abstract: 本说明书实施例提供一种基于隐私保护确定多个业务方的相同业务数据的方法,通过在各个业务方按照相同规则分别设置的4个哈希表,结合布谷鸟哈希,以及相同业务数据的散列值存储位置重合原理,使得两两业务方之间的数据比较次数大大减少,例如减少至8(子表数量)与业务数据较多的业务方所拥有的业务数据条数的乘积,提高比较效率,另一方面,采用基于秘密共享的等式比较方式进行相应位置的两方数据比较,并在数据比较过程中采用随机抽取部分位比较的方法,减少安全比较过程中的计算量,提高比较效率。总之,本说明书的技术构思可以在隐私保护的基础上,提高确定多个业务方的相同业务数据的效率。

    利用业务决策模型进行决策处理的方法及装置

    公开(公告)号:CN111445032A

    公开(公告)日:2020-07-24

    申请号:CN202010537464.1

    申请日:2020-06-12

    Inventor: 尹红军 王力 周俊

    Abstract: 本说明书实施例提供一种利用业务决策模型进行决策处理的方法及装置。在该方法中,服务平台可以获取第一业务处理请求,确定第一业务处理请求的第一业务特征;将第一业务特征输入利用强化学习得到的业务决策模型,得到第一业务处理请求针对多个决策行为的第一得分分布;利用多个历史业务处理请求,确定针对第一业务处理请求的决策干预系数,利用决策干预系数,对第一得分分布进行干预处理,得到针对多个决策行为的第二得分分布;基于第二得分分布,从多个决策行为中确定针对第一业务处理请求的决策行为。

    多方联合对隐私数据进行降维处理的方法和装置

    公开(公告)号:CN111401479A

    公开(公告)日:2020-07-10

    申请号:CN202010307728.4

    申请日:2020-04-17

    Abstract: 本说明书实施例提供一种多方联合对隐私数据进行降维处理的方法和装置,在隐私数据纵向分布的情况下,第一持有方针对第一原始矩阵进行零均值化得到第一中心矩阵,获取N*N维的非对称正交矩阵,将非对称正交矩阵与第一中心矩阵相乘得到第一隐秘矩阵,将第一隐秘矩阵发送至可信第三方。可信第三方对各个隐秘矩阵进行拼接得到全局隐秘矩阵,全局隐秘矩阵与其转置矩阵相乘得到协方差矩阵,对协方差矩阵进行本征值求解得到降维变换矩阵,对降维变换矩阵进行拆分后得到各个拆分矩阵,并发送至持有方。第一持有方用第一拆分矩阵处理第一原始矩阵得到第一降维矩阵,用以通过机器学习的方式对业务对象进行业务预测分析。

    图像识别模型的训练方法及装置、图像识别方法及装置

    公开(公告)号:CN111275120A

    公开(公告)日:2020-06-12

    申请号:CN202010075299.2

    申请日:2020-01-22

    Abstract: 本说明书实施例公开了一种图像识别模型的训练方法及装置、图像识别方法及装置。其中,训练方法包括:将待训练的第二图像识别模型中的每层卷积神经网络,分别与训练完的第一图像识别模型中的一个子网络相对应。根据训练完的第一图像识别模型中每个子网络的输入和输出,对待训练的第二图像识别模型中的每层卷积神经网络的参数进行初始化处理。将样本图像输入参数初始化处理后的待训练的第二图像识别模型,根据待训练的第二图像识别模型的输出和样本图像的标签,对待训练的第二图像识别模型进行训练。由此,实现了根据训练完的第一图像识别模型,对待训练的第二图像识别模型进行参数初始化处理,以加快对待训练的第二图像识别模型进行的训练。

    保护数据隐私的双方联合训练业务预测模型的方法和装置

    公开(公告)号:CN111241570A

    公开(公告)日:2020-06-05

    申请号:CN202010329627.7

    申请日:2020-04-24

    Inventor: 王力 陈超超 周俊

    Abstract: 本说明书实施例提供一种保护数据隐私的双方联合训练业务预测模型的方法和装置,其中第一方和第二方分别拥有一部分特征数据,分别维护第一和第二参数部分。在模型迭代时,双方各自计算其特征矩阵与参数的乘积结果,第一方将其乘积结果同态加密后发送给拥有标签的第二方,由第二方进行同态运算,得到加密误差向量。然后,第二方对该加密误差向量添加混淆向量后发送给第一方,并与第一方各自采用该混淆向量和特征矩阵进行安全矩阵乘法,得到乘积分片。第二方可选的对乘积分片添加混淆,然后发给第一方。第一方由此确定出其第一梯度,据此更新其参数。

    用户类别识别模型的训练方法和用户类别识别方法

    公开(公告)号:CN111222026A

    公开(公告)日:2020-06-02

    申请号:CN202010023203.8

    申请日:2020-01-09

    Abstract: 本说明书实施例公开了一种用户类别识别模型的训练方法和用户类别识别方法,训练方法包括:将样本用户的联系人列表输入用户类别计算模型,以生成样本用户属于预设类别的概率。将样本用户对应的软件特征,和样本用户属于预设类别的概率,输入用户类别识别模型,以生成样本用户的识别结果。根据样本用户的识别结果和样本用户的类别标签,对用户类别识别模型中的参数,以及样本用户的常用软件列表中每个常用软件对应的软件特征进行优化。当满足预设条件时,完成对用户类别识别模型的训练。由此,使得训练完的用户类别识别模型能够在用户信息不充分的情况下,基于待识别用户的联系人列表和对应的软件特征,实现用户类别识别。

    保护数据隐私的双方联合训练业务预测模型的方法和装置

    公开(公告)号:CN111178549A

    公开(公告)日:2020-05-19

    申请号:CN202010276696.6

    申请日:2020-04-10

    Abstract: 本说明书实施例提供一种保护数据隐私的双方联合训练业务预测模型的方法和装置,其中双方各自拥有一部分特征数据。在模型迭代过程中,双方通过安全矩阵乘法,得到总的特征矩阵X与总的参数矩阵W的乘积结果的两个乘积分片。拥有标签的第二方对标签向量Y进行秘密分享,使双方得到两个标签分片。于是,双方各自根据持有的乘积分片和标签分片计算出对应的误差分片。然后双方基于各自的误差分片和特征矩阵,通过秘密分享和安全矩阵乘法,得到对应的梯度分片。然后,第一方利用其梯度分片更新其维护的参数分片,第二方利用其梯度分片更新其维护的参数分片。如此实现保护数据隐私的安全联合训练。

    模型训练方法、成员探测装置的训练方法及其系统

    公开(公告)号:CN111079946A

    公开(公告)日:2020-04-28

    申请号:CN201911333307.2

    申请日:2019-12-20

    Inventor: 周俊

    Abstract: 本说明书中的实施例提供了模型训练方法、成员探测装置的训练方法及其系统,以防范成员攻击造成的数据隐私泄露。其中,成员探测装置可以基于特征数据、标签数据和模型的预测结果评估攻击者基于这些数据成功探测出该特征数据是否属于模型训练集的概率。进而,模型训练系统可以通过调节所训练模型的参数和/或结构来降低该概率。

    基于数据隐私保护的机器学习模型特征筛选方法及装置

    公开(公告)号:CN111079939A

    公开(公告)日:2020-04-28

    申请号:CN201911194023.X

    申请日:2019-11-28

    Inventor: 陈超超 王力 周俊

    Abstract: 本说明书实施例提供用于基于数据隐私保护的机器学习模型特征筛选的方法。机器学习模型具有模型特征集,并且机器学习模型的特征数据被水平切分地分布在第一数据拥有方和至少一个第二数据拥有方处,每个数据拥有方具有与模型特征集对应的特征数据。第一数据拥有方和至少一个第二数据拥有方协同来使用第一数据拥有方的特征数据进行多方安全计算,以训练出待筛选模型特征的预测模型。在第一数据拥有方处,基于待筛选模型特征的预测差值确定待筛选模型特征的方差膨胀因子,以用于对待筛选模型特征进行模型特征筛选处理。

Patent Agency Ranking