-
公开(公告)号:CN118708963A
公开(公告)日:2024-09-27
申请号:CN202410748657.X
申请日:2024-06-11
Applicant: 桂林电子科技大学
IPC: G06F18/214 , G06F18/2132 , G06N20/00
Abstract: 本发明涉及大数据处理技术领域,提供了一种联邦推荐中集成改进伪标签技术和梯度对齐自适应正则化的数据再平衡方法,该方法利用该框架来应对数据不平衡,首先根据z分数来识别数据过多或过少的客户端。对于数据过少的客户端,采用改进伪标签技术,通过双模型评估机制来增强样本的可靠性,其中双模型是由单个客户端上的本地模型和全局模型组成的。对于每个无标签样本,只有双模型产生的2个预测同时满足一定阈值时,才为该样本赋予伪标签;对于数据过多的客户端,BalFed执行下采样。此外,本发明在本地模型更新时采用了一种梯度对齐自适应正则化,旨在提高联邦推荐系统的鲁棒性。本发明适用于任何联邦推荐模型以应对联邦推荐系统中的数据不平衡。