-
公开(公告)号:CN114546608A
公开(公告)日:2022-05-27
申请号:CN202210007565.7
申请日:2022-01-06
Applicant: 上海交通大学
Abstract: 本发明涉及一种基于边缘计算的任务调度方法,该方法包括以下步骤:各区域维护有一策略网络,基于该策略网络和实时环境,各区域独立对本区域内实时接收到的任务进行调度;所述策略网络的网络参数采用基于联邦学习的深度强化学习算法进行在线更新,具体地:各区域保存历史数据形成本地数据集,基于本地数据集进行深度强化学习训练,更新网络参数,训练目标为最小化所有任务的奖励值;各区域将自身网络参数发送至中央基站,中央基站进行基于联邦学习的统一更新后,将更新后的网络参数反馈给各区域。与现有技术相比,本发明具有增强模型扩展性、保护数据隐私性、提高系统性能等优点。
-
公开(公告)号:CN114546608B
公开(公告)日:2024-06-07
申请号:CN202210007565.7
申请日:2022-01-06
Applicant: 上海交通大学
IPC: G06F9/48 , G06F9/50 , G06N3/0499 , G06N3/092 , G06N3/098
Abstract: 本发明涉及一种基于边缘计算的任务调度方法,该方法包括以下步骤:各区域维护有一策略网络,基于该策略网络和实时环境,各区域独立对本区域内实时接收到的任务进行调度;所述策略网络的网络参数采用基于联邦学习的深度强化学习算法进行在线更新,具体地:各区域保存历史数据形成本地数据集,基于本地数据集进行深度强化学习训练,更新网络参数,训练目标为最小化所有任务的奖励值;各区域将自身网络参数发送至中央基站,中央基站进行基于联邦学习的统一更新后,将更新后的网络参数反馈给各区域。与现有技术相比,本发明具有增强模型扩展性、保护数据隐私性、提高系统性能等优点。
-