-
公开(公告)号:CN115759179A
公开(公告)日:2023-03-07
申请号:CN202211443933.9
申请日:2022-11-18
Applicant: 中国科学院自动化研究所
IPC: G06N3/04 , G06N3/08 , G06F18/214
Abstract: 本发明实施例涉及人工智能领域,公开了一种应用于多任务学习的策略模型训练方法、装置及设备。本发明实施例涉及的应用于多任务学习的策略模型训练方法包括:获取目标任务集;调用第一策略模型对每个目标任务进行训练,得到第二策略模型以及第一子训练结果;对所述第二策略模型依次进行第一参数调整,得到第三策略模型以及第二子训练结果;对所述第三策略模型依次进行第二参数调整,得到第四策略模型;确定所述第四策略模型为应用于多任务学习的策略模型。这样,策略模型在多任务学习中受到多任务间梯度差异的影响会减少,进而使任务间的训练进度更平均,提高训练效率。