-
公开(公告)号:CN113364543B
公开(公告)日:2022-03-15
申请号:CN202110620727.X
申请日:2021-06-03
Applicant: 厦门大学
IPC: H04B17/391 , H04B17/345 , H04W16/22 , G06N3/04 , G06N3/08
Abstract: 一种基于联邦强化学习的边缘计算模型训练方法,涉及无线通信和信息安全。1)检测信号覆盖范围内的移动设备数量,构建卷积神经网络,初始化参数;2)将各移动设备的参数组成状态向量输入卷积神经网络中,得选择的移动设备和训练数据量;3)将全局模型参数和选择的数据量发送给移动设备,接收移动设备的本地模型参数,更新全局模型参数;4)根据各移动设备的训练时间、目标识别精度和能量消耗作为奖励值,更新状态向量、存储向量;5)从内存中随机选取存储的向量更新卷积神经网络的权重参数;6)重复2)~5)至移动设备反馈的目标识别精度的平均值大于所需的目标识别精度。提高T秒内目标识别精度,减少训练时间和移动设备能量消耗。
-
公开(公告)号:CN113364543A
公开(公告)日:2021-09-07
申请号:CN202110620727.X
申请日:2021-06-03
Applicant: 厦门大学
IPC: H04B17/391 , H04B17/345 , H04W16/22 , G06N3/04 , G06N3/08
Abstract: 一种基于联邦强化学习的边缘计算模型训练方法,涉及无线通信和信息安全。1)检测信号覆盖范围内的移动设备数量,构建卷积神经网络,初始化参数;2)将各移动设备的参数组成状态向量输入卷积神经网络中,得选择的移动设备和训练数据量;3)将全局模型参数和选择的数据量发送给移动设备,接收移动设备的本地模型参数,更新全局模型参数;4)根据各移动设备的训练时间、目标识别精度和能量消耗作为奖励值,更新状态向量、存储向量;5)从内存中随机选取存储的向量更新卷积神经网络的权重参数;6)重复2)~5)至移动设备反馈的目标识别精度的平均值大于所需的目标识别精度。提高T秒内目标识别精度,减少训练时间和移动设备能量消耗。
-