-
公开(公告)号:CN105373583A
公开(公告)日:2016-03-02
申请号:CN201510657157.6
申请日:2015-10-12
Applicant: 国家计算机网络与信息安全管理中心 , 天津神舟通用数据技术有限公司
CPC classification number: G06F16/2462 , G06K9/6269
Abstract: 本发明涉及一种基于数据压缩的支撑向量机建模方法,其技术特点是包括:采用等距抽样方法对建模数据进行抽样;对建模数据进行压缩;对聚类特征树的叶子节点下的每一簇数据,计算其边界,取最有可能成为支撑向量的边界点作为支撑向量机的建模数据;建立支撑向量机模型:根据建模数据利用支撑向量机方法,建立支撑向量机模型。本发明采用预抽样策略、数据压缩技术、增量抽样策略等,在尽量不降低算法准确率的情况下,大幅降低支撑向量机建模样本数,从而大幅提高支撑向量机建模速度,降低内存消耗,从而使得支撑向量机技术能够在大数据分析场景中应用,弥补大数据分析中神经网络、贝叶斯等方法预测准确率较低的缺陷。