-
公开(公告)号:CN119740027A
公开(公告)日:2025-04-01
申请号:CN202411725487.X
申请日:2024-11-28
Applicant: 北京邮电大学
IPC: G06F18/214 , G06F18/20 , G06N3/0464 , G06N3/0475 , G06N3/045 , G06N3/094 , G06N3/092 , G06N3/098 , G06F21/62 , H04L27/00 , H04L41/16
Abstract: 本申请提供的基于联邦强化学习的数据增强方法及相关设备,实现对训练性能和增强样本数量的优化,包括:获取至少一个初始模型的第一模型参数;基于生成对抗网络处理第一模型参数,确定第一增强数据集;将至少一个初始模型通过联邦平均算法处理,得到全局模型;基于马尔可夫决策过程、第一模型参数以及第一增强数据集的第一样本数量,确定增强数据策略;根据全局模型的第二模型参数和增强数据策略,训练初始模型,得到局部模型;根据全局模型在测试集上的测试准确率和第二样本数量,得到策略奖励;基于多智能体强化优化算法,将初始模型、增强数据策略、局部模型以及策略奖励作为训练样本,存储到样本池中;根据训练样本迭代训练局部模型。