一种基于网络数据的主动学习方法及装置

    公开(公告)号:CN104462614A

    公开(公告)日:2015-03-25

    申请号:CN201510018109.2

    申请日:2015-01-14

    Applicant: 苏州大学

    CPC classification number: G06F17/30705

    Abstract: 本发明提供了一种基于网络数据的主动学习方法及装置,本发明利用未标注样本构建样本关系矩阵,样本关系矩阵中不仅包含每个样本的自身信息含量,还包括各个未标注样本之间的关系信息含量,所以样本关系矩阵考虑了样本的非独立分布的特性,即各个样本之间的关系特性;在样本关系矩阵的基础上构建目标函数,目标函数值越大代表所挑选的样本的信息含量越大,求解目标函数得到使目标函数值最大的多个未标注样本,多个未标注样本组成最优样本子集。本申请能够在大量未标注的网络数据中选择最优样本子集,以便对选择的样本子集进行人工标注后,重新构建分类器模型,从而提高分类器模型对网络数据的分类性能。

Patent Agency Ranking