-
公开(公告)号:CN117892154A
公开(公告)日:2024-04-16
申请号:CN202410292307.7
申请日:2024-03-14
Applicant: 东北大学
Abstract: 本发明属于联邦学习场景下的个性化技术领域,公开了一种个性化联邦场景下基于数据分布相似性的聚类方法。不同用户数据在相同模型下的softmax输出均值近似表示用户的真实数据分布,计算Wasserstein距离得到真实数据分布之间的相似性。采用改进的两阶段的层次聚类的方法做聚类,确定簇结构。最后,各个用户分别在自己的簇内做联邦平均,各自更新每个簇的簇头模型,直到簇头模型收敛。本发明减少中央服务器在执行聚类算法时的计算开销,提升了确定最优簇结构的效率,增强了聚类算法的鲁棒性,有效解决了聚类联邦学习训练效率低的问题。对于真实的联邦环境具有相当的适用价值。