一种模型训练方法、装置、电子设备及存储介质
摘要:
本申请公开了一种模型训练方法、装置、电子设备及存储介质,涉及模型训练领域。具体实现方案为:在第一阶段的微调训练中,将各个第一样本类型的训练样本输入至待训练模型的共享层模块中;基于各个第一样本类型的训练样本对共享层模块中的模型参数进行调整;通过共享层模块将各个第一样本类型的训练样本输入至待训练模型的各个任务类型对应的任务层模块中;通过各个任务层模块提取出自身匹配的训练数据;并基于各个任务层模块匹配的训练数据对各个任务层模块中的模型参数进行调整。本申请实施例不仅可以统一对共享层模块进行训练,而且还可以单独对各个任务层模块进行训练,在提升单任务性能的同时保留多任务训练的效果。
0/0