一种用于文本多分类任务的在线主动机器学习方法

    公开(公告)号:CN111949794B

    公开(公告)日:2024-06-28

    申请号:CN202010817161.5

    申请日:2020-08-14

    Applicant: 扬州大学

    Inventor: 翟婷婷 龚楷伦

    Abstract: 本发明公开了一种用于文本多分类任务的在线主动机器学习方法,包括以下步骤:1)在第t轮,接收到本轮的文档经特征提取后得到的特征向量xt;2)使用最新的多分类器Wt对xt进行预测,得到多分类预测结果#imgabs0#3)在线预测结束后,进入采样决策程序:判断是否获取xt的真实类标签yt;记Zt为采样决策变量,如果Zt=1,则获取yt,得到完整的数据信息(xt,yt);如果Zt=0,则不获取yt,也不更新当前的多分类器,直接进入步骤5);4)得到完整的数据信息(xt,yt)后,进入在线更新程序,更新当前的多分类器Wt,得到下一轮的多分类器Wt+1;5)回到步骤1),进行第t+1轮的文本特征向量的提取;本发明在同等的类标签采样比例下,能取得更高的在线多分类准确率。

    一种用于文本多分类任务的在线主动机器学习方法

    公开(公告)号:CN111949794A

    公开(公告)日:2020-11-17

    申请号:CN202010817161.5

    申请日:2020-08-14

    Applicant: 扬州大学

    Inventor: 翟婷婷 龚楷伦

    Abstract: 本发明公开了一种用于文本多分类任务的在线主动机器学习方法,包括以下步骤:1)在第t轮,接收到本轮的文档经特征提取后得到的特征向量xt;2)使用最新的多分类器Wt对xt进行预测,得到多分类预测结果3)在线预测结束后,进入采样决策程序:判断是否获取xt的真实类标签yt;记Zt为采样决策变量,如果Zt=1,则获取yt,得到完整的数据信息(xt,yt);如果Zt=0,则不获取yt,也不更新当前的多分类器,直接进入步骤5);4)得到完整的数据信息(xt,yt)后,进入在线更新程序,更新当前的多分类器Wt,得到下一轮的多分类器Wt+1;5)回到步骤1),进行第t+1轮的文本特征向量的提取;本发明在同等的类标签采样比例下,能取得更高的在线多分类准确率。

Patent Agency Ranking