- 专利标题: 模型训练方法、业务处理方法、装置及相关设备
-
申请号: CN201910211389.7申请日: 2019-03-19
-
公开(公告)号: CN109978177B公开(公告)日: 2023-06-23
- 发明人: 孙浩博 , 张红林
- 申请人: 腾讯科技(深圳)有限公司
- 申请人地址: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人地址: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 代理机构: 广州三环专利商标代理有限公司
- 代理商 郝传鑫; 熊永强
- 主分类号: G06N20/00
- IPC分类号: G06N20/00
摘要:
本发明实施例公开了一种模型训练方法、业务处理方法、装置及相关设备,其中应用于第一节点设备的模型训练方法包括:获取目标模型中的目标特征的权重参数;根据所述目标特征的权重参数确定所述目标特征的当前梯度累积量;若所述当前梯度累积量满足预设条件,则获取所述目标特征的近似动量;向第二节点设备发送所述目标特征的近似动量,使所述第二节点设备采用所述目标特征的近似动量更新所述目标模型;本发明实施例采用该模型训练方法可以提升模型训练效率,缓解通信压力,避免额外的内存消耗。
公开/授权文献
- CN109978177A 模型训练方法、业务处理方法、装置及相关设备 公开/授权日:2019-07-05