联合训练伽马回归模型的方法及装置

    公开(公告)号:CN118520969A

    公开(公告)日:2024-08-20

    申请号:CN202310180119.0

    申请日:2023-02-17

    发明人: 刘颖婷 王磊

    摘要: 本说明书实施例提供一种联合训练伽马回归模型的方法及装置,涉及n个参与方。该方法由其中任意的第i个参与方执行,包括:先与其他的n‑1个参与方共同进行针对训练样本集的秘密分享分片,得到第i个特征分片和第i个标签分片;再基于第i个特征分片和第i个标签分片,与其他的n‑1个参与方联合进行对应伽马回归模型的第i个参数分片的多轮次迭代更新,模型参数分片的迭代更新可以按需选用设计的多种模型优化器之一,例如,适用于小规模数据的安全迭代重加权最小二乘法、适用于大规模数据的安全批次迭代重加权最小二乘法、大小规模数据都适用的安全随机梯度下降法等,如此可以提高执行效率。另外,各种模型优化器涉及的密文运算为秘密分享运算,使得执行更加高效。

    检测用户属性之间的关联性的方法及装置

    公开(公告)号:CN110909216B

    公开(公告)日:2023-06-20

    申请号:CN201911228336.2

    申请日:2019-12-04

    IPC分类号: G06F16/903 G06F21/62

    摘要: 本说明书实施例提供了检测用户属性之间的关联性的方法和装置,用于在S个数据方基于安全计算的业务处理中,针对S个数据方联合提供的m个样本用户,检测p个用户属性之间的关联性。其中,S个数据方本地分别拥有部分用户属性数据作为隐私数据。为了维护各个数据方的隐私数据的安全性,可以由各个数据方拆分计算p个用户属性对应的协方差矩阵,并根据协方差矩阵,分别确定p个用户属性中两两用户属性分别对应的各个相关系数,接着基于各个相关系数,以及上述协方差矩阵,检测p个用户属性相互之间的关联性。与常规技术中直接根据属性值计算各个用户属性的VIF,以确定用户属性的关联关系相比,可以大大减少计算的复杂度,提高安全计算的有效性。

    针对大规模数据的对象特征之间相关性的确定方法及装置

    公开(公告)号:CN114781000A

    公开(公告)日:2022-07-22

    申请号:CN202210702081.4

    申请日:2022-06-21

    发明人: 刘颖婷 王力

    IPC分类号: G06F21/62 G06F17/16 G06F17/18

    摘要: 本说明书实施例提供了一种针对大规模数据的对象特征之间相关性的确定方法及装置。多方联合利用多方安全计算检测样本特征是否符合正态分布,当符合时,各方联合对样本进行安全标准化,之后进行随机采样,并对大规模数据进行选取,进而得到特征采样分片,然后各方利用多方安全计算相关技术,基于各方的采样分片确定特征之间的皮尔逊积矩相关系数。当检测出样本特征不符合正态分布时,参与方对特征矩阵中的特征值进行排序,并采用序号值分片代替特征值分片,接着进行随机采样,进一步得到排序数据的采样分片。然后,各方利用多方安全计算相关技术,基于各方的采样分片确定特征之间的斯皮尔曼等级相关系数。整个处理过程对隐私数据进行了保护。

    多方联合对隐私数据进行降维处理的方法和装置

    公开(公告)号:CN111401479A

    公开(公告)日:2020-07-10

    申请号:CN202010307728.4

    申请日:2020-04-17

    IPC分类号: G06K9/62 G06F21/62 G06N20/00

    摘要: 本说明书实施例提供一种多方联合对隐私数据进行降维处理的方法和装置,在隐私数据纵向分布的情况下,第一持有方针对第一原始矩阵进行零均值化得到第一中心矩阵,获取N*N维的非对称正交矩阵,将非对称正交矩阵与第一中心矩阵相乘得到第一隐秘矩阵,将第一隐秘矩阵发送至可信第三方。可信第三方对各个隐秘矩阵进行拼接得到全局隐秘矩阵,全局隐秘矩阵与其转置矩阵相乘得到协方差矩阵,对协方差矩阵进行本征值求解得到降维变换矩阵,对降维变换矩阵进行拆分后得到各个拆分矩阵,并发送至持有方。第一持有方用第一拆分矩阵处理第一原始矩阵得到第一降维矩阵,用以通过机器学习的方式对业务对象进行业务预测分析。

    多方联合对隐私数据进行显著性检验的方法和装置

    公开(公告)号:CN111506922B

    公开(公告)日:2023-03-10

    申请号:CN202010307722.7

    申请日:2020-04-17

    IPC分类号: G06F21/62 G06N20/00

    摘要: 本说明书实施例提供一种多方联合对隐私数据进行显著性检验的方法和装置,隐私数据分布在M个持有方中,M个持有方各自的原始矩阵能假定构成联合矩阵,联合矩阵对应于N个业务对象针对D项属性项的属性值构成的矩阵,检验方在获取到N个业务对象对应的N个预测值以及D项属性项对应的D个模型参数时,将对N个预测值的预定计算结果作为对角元素构建N*N维的预测值矩阵,利用秘密共享的矩阵乘法SMM,基于预测值矩阵以及M个持有方各自的原始矩阵进行乘操作,得到多个子矩阵,并构建中间矩阵,将中间矩阵的逆矩阵确定为预测值矩阵与联合矩阵形成的D*D维的方差协方差矩阵;基于方差协方差矩阵的对角元素,采用显著性检验法,确定属性项的显著性水平值。

    针对逻辑回归模型进行联合训练的方法及装置

    公开(公告)号:CN115048674A

    公开(公告)日:2022-09-13

    申请号:CN202210744765.0

    申请日:2022-06-28

    发明人: 刘颖婷 王力 王磊

    摘要: 本说明书实施例提供一种多方联合针对逻辑回归模型进行联合训练的方法及装置,在多方联合利用各自的隐私数据进行逻辑回归模型训练过程中,利用多项式、分段函数等对逻辑斯蒂函数进行近似计算,以减少逻辑斯蒂函数计算的复杂度。具体地,针对训练数据的特点,结合各个数据持有方所持有的隐私数据的实际情况,确定对逻辑斯蒂函数近似计算的不同精度需求,从而选择逻辑回归模型中针对逻辑斯蒂函数的近似方案。该方式可以兼顾多方安全计算的逻辑回归模型准确性和效率需求,提高多方安全计算场景下联合训练逻辑回归模型的有效性。

    控制通信量的确定业务数据特征有效值的方法及装置

    公开(公告)号:CN113407988A

    公开(公告)日:2021-09-17

    申请号:CN202110580162.7

    申请日:2021-05-26

    IPC分类号: G06F21/62 G06N20/00

    摘要: 本说明书实施例提供一种控制通信量的确定业务数据特征有效值的方法及装置。业务数据属于隐私数据,多个参与方的业务数据可假定拼接成联合数据,其包括多个对象针对多个特征项的特征值。多方分别获取联合数据分片、样本的预测值分片以及模型参数分片。多方中的选定参与方,利用多方中的预测值分片重构完整的预测值数据;利用多方安全计算,通过多方交互,基于多方的联合数据分片和选定参与方的预测值数据,确定多方分别对应的相关性数据分片,其中包括多个特征项之间的相关性数据;采用显著性检验法,通过多方之间的安全交互,基于多方的模型参数分片和相关性数据分片中的对应数据,确定模型参数对应的特征项在提升业务预测模型效果上的有效值。

    针对隐私数据进行多方联合降维处理的方法及装置

    公开(公告)号:CN111400766B

    公开(公告)日:2021-08-06

    申请号:CN202010220436.7

    申请日:2020-03-25

    摘要: 本说明书实施例提供一种针对隐私数据进行多方联合降维的方法和装置。其中多方中的各个数据持有方,对其本地拥有的隐私数据矩阵进行转置相乘运算,得到乘积矩阵后,使用第三方的公钥对乘积矩阵进行同态加密,然后,汇总到某个运算平台中进行同态加和操作,将同态加和结果发至第三方。第三方对同态加和结果解密,可得到主成分分析所需的协方差矩阵,进而确定出降维变换矩阵,广播给各个持有方。于是,各个持有方可以利用该降维变换矩阵进行降维处理。通过这样的方式,确保了各个持有方中隐私数据的安全。

    多方联合对隐私数据进行显著性检验的方法和装置

    公开(公告)号:CN111506922A

    公开(公告)日:2020-08-07

    申请号:CN202010307722.7

    申请日:2020-04-17

    IPC分类号: G06F21/62 G06N20/00

    摘要: 本说明书实施例提供一种多方联合对隐私数据进行显著性检验的方法和装置,隐私数据分布在M个持有方中,M个持有方各自的原始矩阵能假定构成联合矩阵,联合矩阵对应于N个业务对象针对D项属性项的属性值构成的矩阵,检验方在获取到N个业务对象对应的N个预测值以及D项属性项对应的D个模型参数时,将对N个预测值的预定计算结果作为对角元素构建N*N维的预测值矩阵,利用秘密共享的矩阵乘法SMM,基于预测值矩阵以及M个持有方各自的原始矩阵进行乘操作,得到多个子矩阵,并构建中间矩阵,将中间矩阵的逆矩阵确定为预测值矩阵与联合矩阵形成的D*D维的方差协方差矩阵;基于方差协方差矩阵的对角元素,采用显著性检验法,确定属性项的显著性水平值。