- 专利标题: 一种模型训练方法、装置、电子设备及存储介质
-
申请号: CN201911100649.X申请日: 2019-11-12
-
公开(公告)号: CN110782883B公开(公告)日: 2020-10-20
- 发明人: 潘政林 , 聂志朋 , 白洁
- 申请人: 百度在线网络技术(北京)有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦三层
- 专利权人: 百度在线网络技术(北京)有限公司
- 当前专利权人: 百度在线网络技术(北京)有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦三层
- 代理机构: 北京品源专利代理有限公司
- 代理商 孟金喆
- 主分类号: G10L15/06
- IPC分类号: G10L15/06
摘要:
本申请公开了一种模型训练方法、装置、电子设备及存储介质,涉及模型训练领域。具体实现方案为:在第一阶段的微调训练中,将各个第一样本类型的训练样本输入至待训练模型的共享层模块中;基于各个第一样本类型的训练样本对共享层模块中的模型参数进行调整;通过共享层模块将各个第一样本类型的训练样本输入至待训练模型的各个任务类型对应的任务层模块中;通过各个任务层模块提取出自身匹配的训练数据;并基于各个任务层模块匹配的训练数据对各个任务层模块中的模型参数进行调整。本申请实施例不仅可以统一对共享层模块进行训练,而且还可以单独对各个任务层模块进行训练,在提升单任务性能的同时保留多任务训练的效果。
公开/授权文献
- CN110782883A 一种模型训练方法、装置、电子设备及存储介质 公开/授权日:2020-02-11