-
公开(公告)号:CN109492428A
公开(公告)日:2019-03-19
申请号:CN201811265579.9
申请日:2018-10-29
Applicant: 南京邮电大学
IPC: G06F21/62
Abstract: 本发明公开了一种面向主成分分析的差分隐私保护方法,包括以下步骤:数据矩阵中心化,即每一维度数据减去本维度的均值;对数据矩阵计算协方差矩阵计算协方差矩阵A的特征值λ及特征向量V;计算保留的主成分个数k;将原始数据映射到主成分空间得到投影矩阵Z;给所述投影矩阵Z每列元素分配隐私预算εj,计算添加的随机噪声;给所述投影矩阵Z添加噪声,得到加噪后的投影矩阵Z′;计算原始数据和低秩近似数据间的误差。本发明既可以有效地对数据集降维,实现数据的简化,又可以避免对“不重要”的数据添加噪声,减少隐私预算的浪费,从而提高数据的可用性,使发布的数据尽可能反映真实数据,同时保护了数据的隐私。
-
公开(公告)号:CN109409128A
公开(公告)日:2019-03-01
申请号:CN201811276452.7
申请日:2018-10-30
Applicant: 南京邮电大学
IPC: G06F21/62
Abstract: 本发明公开了一种面向差分隐私保护的频繁项集挖掘方法,包括以下步骤:计算出所有项集的支持度,从中挑选出频繁项集;统计数据集中各条事务的长度,计算出截断长度L后截断数据集;计算频繁项集包含项的个数上限m和频繁项个数λ,根据λ值构造频繁项组成的集合F;构造最大频繁项集MFI集合B及候选项集集合C;使用集合B对集合C中的项集进行加噪;使用初始MFI集合B计算得到各个候选项集的支持度之后,计算与真实支持度的误差之和E;在B中搜索B、B,用B取代B并且更新误差和E的值;当误差和不再减小时停止迭代并输出结果。本发明可以很好地防止发布频繁项集会造成的个人隐私泄露,同时截断数据集的操作也有效地提高了挖掘结果的可用性。
-
公开(公告)号:CN109409128B
公开(公告)日:2022-05-17
申请号:CN201811276452.7
申请日:2018-10-30
Applicant: 南京邮电大学
IPC: G06F21/62
Abstract: 本发明公开了一种面向差分隐私保护的频繁项集挖掘方法,包括以下步骤:计算出所有项集的支持度,从中挑选出频繁项集;统计数据集中各条事务的长度,计算出截断长度L后截断数据集;计算频繁项集包含项的个数上限m和频繁项个数λ,根据λ值构造频繁项组成的集合F;构造最大频繁项集MFI集合B及候选项集集合C;使用集合B对集合C中的项集进行加噪;使用初始MFI集合B计算得到各个候选项集的支持度之后,计算与真实支持度的误差之和E;在B中搜索B、B,用B取代B并且更新误差和E的值;当误差和不再减小时停止迭代并输出结果。本发明可以很好地防止发布频繁项集会造成的个人隐私泄露,同时截断数据集的操作也有效地提高了挖掘结果的可用性。
-
-