一种基于差分隐私的隐私保护聚类方法

    公开(公告)号:CN113704787A

    公开(公告)日:2021-11-26

    申请号:CN202111006314.9

    申请日:2021-08-30

    Abstract: 一种基于差分隐私的隐私保护聚类方法,包括:(1)数据所有者计算原数据集中各数据点间的欧氏距离,构建距离矩阵;(2)向距离矩阵添加差分噪声,形成加噪距离矩阵,并将其共享给不可信数据挖掘方,避免聚类分析过程泄露数据隐私;(3)数据挖掘方在加噪距离矩阵中选取k个有良好全局分布性的非离群点,作为聚类的初始中心点;(4)计算每个数据点的最近q个中心点序列,并将数据点分配到距其最近的q个中心点的期望区间内,形成本轮聚簇划分;(5)将每个聚簇内部点间距离和最小的数据点选为新的中心点。重复这一过程,直到各聚簇中心点不再改变。本发明所提方法在实现敏感数据差分隐私保护的同时,可以有效提升聚类挖掘精度。

Patent Agency Ranking