-
公开(公告)号:CN113778691B
公开(公告)日:2022-03-25
申请号:CN202111323172.9
申请日:2021-11-10
Applicant: 清华大学
Abstract: 本发明提供了一种任务迁移决策的方法、装置及系统,其中,该方法包括:获取多个终端上传的至少一个时段的本地经验信息,将同一时段的多个本地经验信息进行整合,生成时段的全局经验信息;将从多个时段的全局经验信息中选取来自不同决策组的训练参数进行整合,生成训练经验信息,并根据训练经验信息对所有在线执行网络进行训练,确定每个在线执行网络的网络参数;根据终端的分组信息,将决策组对应的网络参数发送至决策组中的终端。通过本发明实施例提供的任务迁移决策的方法、装置及系统,能够更新大量终端的网络参数,提高了训练的稳定性和训练结果的性能,可以保证终端的任务迁移决策效果。
-
公开(公告)号:CN113778691A
公开(公告)日:2021-12-10
申请号:CN202111323172.9
申请日:2021-11-10
Applicant: 清华大学
Abstract: 本发明提供了一种任务迁移决策的方法、装置及系统,其中,该方法包括:获取多个终端上传的至少一个时段的本地经验信息,将同一时段的多个本地经验信息进行整合,生成时段的全局经验信息;将从多个时段的全局经验信息中选取来自不同决策组的训练参数进行整合,生成训练经验信息,并根据训练经验信息对所有在线执行网络进行训练,确定每个在线执行网络的网络参数;根据终端的分组信息,将决策组对应的网络参数发送至决策组中的终端。通过本发明实施例提供的任务迁移决策的方法、装置及系统,能够更新大量终端的网络参数,提高了训练的稳定性和训练结果的性能,可以保证终端的任务迁移决策效果。
-