联合训练逻辑回归模型的方法及装置

    公开(公告)号:CN118520966A

    公开(公告)日:2024-08-20

    申请号:CN202310158968.6

    申请日:2023-02-17

    Inventor: 刘颖婷 王磊

    Abstract: 本说明书实施例提供一种联合训练逻辑回归模型的方法及装置。该方法由n个参与方中任意的第i个参与方执行,包括:先与其他的n‑1个参与方共同进行针对训练样本集的秘密分享分片,得到第i个特征分片和第i个标签分片;进一步,基于这两个分片,与其他的n‑1个参与方联合进行对应逻辑回归模型的第i个参数分片的多轮次迭代更新,模型参数分片的迭代更新可以按需选用设计的多种模型优化器之一,例如,适用于小规模数据的安全迭代重加权最小二乘法、适用于大规模数据的安全批次迭代重加权最小二乘法等,如此可以提高执行效率。另外,各种模型优化器涉及的密文运算为秘密分享运算,使得执行更加高效。

    多方联合确定隐私数据中对象特征相关性的方法及装置

    公开(公告)号:CN112818290B

    公开(公告)日:2023-11-14

    申请号:CN202110084215.6

    申请日:2021-01-21

    Abstract: 本说明书实施例提供一种多方联合确定隐私数据中对象特征相关性的方法及装置。隐私数据分布在多个持有方中,第一持有方针对第一原始矩阵中多项特征的特征值进行零均值化,得到第一中心矩阵;利用多方安全计算,基于第一中心矩阵以及其他持有方各自的中心矩阵,确定协方差矩阵的第一分片矩阵。针对第一持有方中的第i特征与第二持有方中的第j特征,第一持有方从本地的协方差矩阵分片、本地存储的特征数据中获取数据,并利用多方安全计算,基于第二持有方的本地特征数据,确定第i特征与第j特征之间的第一相关性系数分片。

    多方联合对隐私数据进行降维处理的方法和装置

    公开(公告)号:CN111401479B

    公开(公告)日:2022-05-17

    申请号:CN202010307728.4

    申请日:2020-04-17

    Abstract: 本说明书实施例提供一种多方联合对隐私数据进行降维处理的方法和装置,在隐私数据纵向分布的情况下,第一持有方针对第一原始矩阵进行零均值化得到第一中心矩阵,获取N*N维的非对称正交矩阵,将非对称正交矩阵与第一中心矩阵相乘得到第一隐秘矩阵,将第一隐秘矩阵发送至可信第三方。可信第三方对各个隐秘矩阵进行拼接得到全局隐秘矩阵,全局隐秘矩阵与其转置矩阵相乘得到协方差矩阵,对协方差矩阵进行本征值求解得到降维变换矩阵,对降维变换矩阵进行拆分后得到各个拆分矩阵,并发送至持有方。第一持有方用第一拆分矩阵处理第一原始矩阵得到第一降维矩阵,用以通过机器学习的方式对业务对象进行业务预测分析。

    基于隐私保护的多重共线性检测方法、装置及系统

    公开(公告)号:CN112597540B

    公开(公告)日:2021-10-01

    申请号:CN202110115832.8

    申请日:2021-01-28

    Abstract: 本说明书实施例提供基于隐私保护的多重共线性检测方案。该多重共线性检测方案由多个成员设备执行,每个成员设备具有本地特征数据。各个成员设备对各自的本地特征数据执行数据对齐来构建出联合特征矩阵,并且协同来执行基于隐私保护的多方矩阵乘法计算,求出联合特征矩阵与其转置矩阵的乘积矩阵,每个成员设备具有乘积矩阵的乘积矩阵分片。然后,各个成员设备使用各自的乘积矩阵分片联合确定乘积矩阵的逆矩阵,每个成员设备具有逆矩阵的逆矩阵分片。随后,各个成员设备使用各自的逆矩阵分片以及本地特征数据确定样本数据的各个属性特征的方差膨胀因子,每个成员设备具有各个属性特征的方差膨胀因子的分片数据,并根据各自具有的各个属性特征的方差膨胀因子的分片数据来确定多重共线性。

    针对用户隐私数据进行多方联合降维处理的方法及装置

    公开(公告)号:CN110889139B

    公开(公告)日:2021-03-23

    申请号:CN201911174422.X

    申请日:2019-11-26

    Abstract: 本说明书实施例提供一种针对用户隐私数据进行多方联合降维的方法和装置。其中多方中的各个数据持有方本地拥有部分用户数据作为隐私数据。为了保证各个持有方隐私数据安全,将有待基于各方隐私数据形成的协方差矩阵拆解为各个持有方可以本地计算或者可以通过秘密分享的矩阵乘法SMM进行安全计算的矩阵;并且,通过安全多方计算MPC的方式,共同确定出协方差矩阵的本征矩阵。如此,各个持有方可以基于本征矩阵对本地数据进行降维,并最终形成降维的用户特征数据。通过这样的方式,确保了用户隐私数据的安全。

    一种基于Adam优化算法的多方联合训练方法及系统

    公开(公告)号:CN111460528A

    公开(公告)日:2020-07-28

    申请号:CN202010248683.8

    申请日:2020-04-01

    Abstract: 本说明书一个或多个实施例涉及一种基于Adam优化算法的多方联合训练方法及系统。所述方法包括:基于各个数据持有终端的通信状态确定参与模型参数更新的训练成员;服务器通过多方安全计算的方式获取累计数据;所述累计数据由所述训练成员基于自身的训练数据及其对应的模型参数确定;服务器基于所述累计数据以及样本标签参与累计梯度值的计算;所述累计梯度值用于所述训练成员计算自身的一阶矩和二阶矩,并基于所述一阶矩和二阶矩完成模型参数的更新;所述各个数据终端分别持有自身的训练数据以及与所述训练数据对应的模型参数;所述训练数据包括与实体相关的图像数据、文本数据或声音数据。其中,所述训练数据可以包括私有数据。

    检测用户属性之间的关联性的方法及装置

    公开(公告)号:CN110909216A

    公开(公告)日:2020-03-24

    申请号:CN201911228336.2

    申请日:2019-12-04

    Abstract: 本说明书实施例提供了检测用户属性之间的关联性的方法和装置,用于在S个数据方基于安全计算的业务处理中,针对S个数据方联合提供的m个样本用户,检测p个用户属性之间的关联性。其中,S个数据方本地分别拥有部分用户属性数据作为隐私数据。为了维护各个数据方的隐私数据的安全性,可以由各个数据方拆分计算p个用户属性对应的协方差矩阵,并根据协方差矩阵,分别确定p个用户属性中两两用户属性分别对应的各个相关系数,接着基于各个相关系数,以及上述协方差矩阵,检测p个用户属性相互之间的关联性。与常规技术中直接根据属性值计算各个用户属性的VIF,以确定用户属性的关联关系相比,可以大大减少计算的复杂度,提高安全计算的有效性。

Patent Agency Ranking