Patent search ap:("中国科学院自动化研究所") AND inv:"白丰硕" Page 1

1.

发明公开
一种应用于多任务学习的策略模型训练方法、装置及设备审中-实审

公开(公告)号：CN115759179A

公开(公告)日：2023-03-07

申请号：CN202211443933.9

申请日：2022-11-18

Applicant: 中国科学院自动化研究所

Inventor： 徐博 , 白丰硕 , 王燕娜

IPC: G06N3/04 , G06N3/08 , G06F18/214

Abstract: 本发明实施例涉及人工智能领域，公开了一种应用于多任务学习的策略模型训练方法、装置及设备。本发明实施例涉及的应用于多任务学习的策略模型训练方法包括：获取目标任务集；调用第一策略模型对每个目标任务进行训练，得到第二策略模型以及第一子训练结果；对所述第二策略模型依次进行第一参数调整，得到第三策略模型以及第二子训练结果；对所述第三策略模型依次进行第二参数调整，得到第四策略模型；确定所述第四策略模型为应用于多任务学习的策略模型。这样，策略模型在多任务学习中受到多任务间梯度差异的影响会减少，进而使任务间的训练进度更平均，提高训练效率。

Patent Agency Ranking