一种基于主动学习的样本标注方法

    公开(公告)号:CN112308139A

    公开(公告)日:2021-02-02

    申请号:CN202011186817.4

    申请日:2020-10-29

    Abstract: 本发明公开了一种基于主动学习的样本标注方法,包括如下步骤:S1、从样本池中随机小样本抽样并标注,得到初始标注样本;S2、采用度量学习计算初始标注样本与待标注样本的特征距离,生成特征距离图,遍历特征距离图,在样本池中寻找与初始标注样本距离小于阈值的样本并抽取出来;S3、将抽取出来的样本再次进行标注并汇入初始标注样本形成样本训练库,以样本训练库为样本集训练检索模型;S4、通过检索模型从样本池中检索出更多的负样本再次进行标注,并汇入样本训练库,形成最终的训练集。本发明采用计算特征距离及图片检索的方式快速抽取样本池中的负样本,在保持模型精度的前提下,大幅度降低标注时间,节约成本,利于工业智能算法的多产线推广。

Patent Agency Ranking