一种基于双向抽样组合的大规模数据异常识别方法

    公开(公告)号:CN104462184A

    公开(公告)日:2015-03-25

    申请号:CN201410535911.4

    申请日:2014-10-13

    Abstract: 本发明提供一种基于双向抽样组合的大规模数据异常识别方法,包括以下步骤:对样本数据集进行横向抽样,得到子样本数据集;对子样本数据集进行属性抽样,得到条带数据集;对条带数据集进行异常程度打分;重复执行上述步骤;组合异常程度分数,并计算异常程度分数的期望值。本发明通过双向抽样方法,既解决了样本量大时间复杂度高,又解决了维灾难的问题;利用抽样方法将数据集进行切分,提高了本发明方法的扩展性。

Patent Agency Ranking