-
公开(公告)号:CN111949794B
公开(公告)日:2024-06-28
申请号:CN202010817161.5
申请日:2020-08-14
Applicant: 扬州大学
IPC: G06F18/21 , G06F18/214 , G06N20/00 , G06F16/35
Abstract: 本发明公开了一种用于文本多分类任务的在线主动机器学习方法,包括以下步骤:1)在第t轮,接收到本轮的文档经特征提取后得到的特征向量xt;2)使用最新的多分类器Wt对xt进行预测,得到多分类预测结果#imgabs0#3)在线预测结束后,进入采样决策程序:判断是否获取xt的真实类标签yt;记Zt为采样决策变量,如果Zt=1,则获取yt,得到完整的数据信息(xt,yt);如果Zt=0,则不获取yt,也不更新当前的多分类器,直接进入步骤5);4)得到完整的数据信息(xt,yt)后,进入在线更新程序,更新当前的多分类器Wt,得到下一轮的多分类器Wt+1;5)回到步骤1),进行第t+1轮的文本特征向量的提取;本发明在同等的类标签采样比例下,能取得更高的在线多分类准确率。
-
公开(公告)号:CN111949794A
公开(公告)日:2020-11-17
申请号:CN202010817161.5
申请日:2020-08-14
Applicant: 扬州大学
Abstract: 本发明公开了一种用于文本多分类任务的在线主动机器学习方法,包括以下步骤:1)在第t轮,接收到本轮的文档经特征提取后得到的特征向量xt;2)使用最新的多分类器Wt对xt进行预测,得到多分类预测结果3)在线预测结束后,进入采样决策程序:判断是否获取xt的真实类标签yt;记Zt为采样决策变量,如果Zt=1,则获取yt,得到完整的数据信息(xt,yt);如果Zt=0,则不获取yt,也不更新当前的多分类器,直接进入步骤5);4)得到完整的数据信息(xt,yt)后,进入在线更新程序,更新当前的多分类器Wt,得到下一轮的多分类器Wt+1;5)回到步骤1),进行第t+1轮的文本特征向量的提取;本发明在同等的类标签采样比例下,能取得更高的在线多分类准确率。
-