一种快速提升文本分类性能的机器学习方法和装置

    公开(公告)号:CN110263173A

    公开(公告)日:2019-09-20

    申请号:CN201910565455.0

    申请日:2019-06-27

    Applicant: 南京大学

    Inventor: 李宇峰 石锋

    Abstract: 本发明公开了一种快速提升文本分类性能的机器学习方法和装置,主要用于实现文本分类性能的快速提升。本发明主要的技术方案为:获取与目标任务相关的一组模型;通过复用已有模型选择出需要查询的本文样本,过滤掉不必要的查询,帮助获得更准确的主动学习模型,节省大量的查询代价;基于有标记的文本样本对已有模型的重要程度进行更新,用于更好地过滤不必要的查询。本发明具有易实现、高效的特点,可以基于少量的查询代价,实现模型的快速性能提升。

Patent Agency Ranking