-
公开(公告)号:CN104462614A
公开(公告)日:2015-03-25
申请号:CN201510018109.2
申请日:2015-01-14
Applicant: 苏州大学
IPC: G06F17/30
CPC classification number: G06F17/30705
Abstract: 本发明提供了一种基于网络数据的主动学习方法及装置,本发明利用未标注样本构建样本关系矩阵,样本关系矩阵中不仅包含每个样本的自身信息含量,还包括各个未标注样本之间的关系信息含量,所以样本关系矩阵考虑了样本的非独立分布的特性,即各个样本之间的关系特性;在样本关系矩阵的基础上构建目标函数,目标函数值越大代表所挑选的样本的信息含量越大,求解目标函数得到使目标函数值最大的多个未标注样本,多个未标注样本组成最优样本子集。本申请能够在大量未标注的网络数据中选择最优样本子集,以便对选择的样本子集进行人工标注后,重新构建分类器模型,从而提高分类器模型对网络数据的分类性能。
-
公开(公告)号:CN103927392B
公开(公告)日:2017-03-22
申请号:CN201410183963.X
申请日:2014-05-04
Applicant: 苏州大学
IPC: G06F17/30
Abstract: 本申请公开了一种深层网络数据源异常点的检测方法及系统,该方法包括从深层网络数据源中采集多个初始样本,然后按照预设规则,对每个所述初始样本进行分层得到s层,分层后按照预设算法,确定每一层中包含异常点的概率,按照最优采样策略,将规定的重采样次数分配到s层中,确定每一层的重采样次数,按照确定的重采样次数进行重采样,最后综合重采样数据与分层后的初始样本,进行异常点的检测。本申请的方法对有限的样本数据进行分层处理,由于异常点大部分集中在少数几个层中,通过着重对这几个层的重新采样,可以找到更多的异常点。解决了对深层网络数据源异常点的检测问题。
-
公开(公告)号:CN103927392A
公开(公告)日:2014-07-16
申请号:CN201410183963.X
申请日:2014-05-04
Applicant: 苏州大学
IPC: G06F17/30
CPC classification number: G06F17/3089
Abstract: 本申请公开了一种深层网络数据源异常点的检测方法及系统,该方法包括从深层网络数据源中采集多个初始样本,然后按照预设规则,对每个所述初始样本进行分层得到s层,分层后按照预设算法,确定每一层中包含异常点的概率,按照最优采样策略,将规定的重采样次数分配到s层中,确定每一层的重采样次数,按照确定的重采样次数进行重采样,最后综合重采样数据与分层后的初始样本,进行异常点的检测。本申请的方法对有限的样本数据进行分层处理,由于异常点大部分集中在少数几个层中,通过着重对这几个层的重新采样,可以找到更多的异常点。解决了对深层网络数据源异常点的检测问题。
-
-