-
公开(公告)号:CN104462184A
公开(公告)日:2015-03-25
申请号:CN201410535911.4
申请日:2014-10-13
Applicant: 北京系统工程研究所
IPC: G06F17/30
Abstract: 本发明提供一种基于双向抽样组合的大规模数据异常识别方法,包括以下步骤:对样本数据集进行横向抽样,得到子样本数据集;对子样本数据集进行属性抽样,得到条带数据集;对条带数据集进行异常程度打分;重复执行上述步骤;组合异常程度分数,并计算异常程度分数的期望值。本发明通过双向抽样方法,既解决了样本量大时间复杂度高,又解决了维灾难的问题;利用抽样方法将数据集进行切分,提高了本发明方法的扩展性。