基于数据压缩的支撑向量机建模方法

    公开(公告)号:CN105373583A

    公开(公告)日:2016-03-02

    申请号:CN201510657157.6

    申请日:2015-10-12

    CPC classification number: G06F16/2462 G06K9/6269

    Abstract: 本发明涉及一种基于数据压缩的支撑向量机建模方法,其技术特点是包括:采用等距抽样方法对建模数据进行抽样;对建模数据进行压缩;对聚类特征树的叶子节点下的每一簇数据,计算其边界,取最有可能成为支撑向量的边界点作为支撑向量机的建模数据;建立支撑向量机模型:根据建模数据利用支撑向量机方法,建立支撑向量机模型。本发明采用预抽样策略、数据压缩技术、增量抽样策略等,在尽量不降低算法准确率的情况下,大幅降低支撑向量机建模样本数,从而大幅提高支撑向量机建模速度,降低内存消耗,从而使得支撑向量机技术能够在大数据分析场景中应用,弥补大数据分析中神经网络、贝叶斯等方法预测准确率较低的缺陷。

    基于遗传算法的多阶段神经网络模型训练方法

    公开(公告)号:CN105303252A

    公开(公告)日:2016-02-03

    申请号:CN201510657269.1

    申请日:2015-10-12

    Abstract: 本发明涉及一种基于遗传算法的多阶段神经网络模型训练方法,其技术特点是包括以下步骤:对数据进行预处理以消除字段的量纲影响;根据输入层、隐含层、输出层节点数,构建多输入层网络结构;采用遗传算法训练初始权重和阈值;利用迭代算法更新权重;根据迭代次数及模型误差判断是否满足模型终止条件:如果满足,则模型结束,否则重新更新权重。本发明针对过程控制中参数分阶段影响输出的问题,构建一个多阶段神经网络结构,根据遗传算法具有全局搜索的特点,采用其为网络结构选择一组较合理的初始权重,从而尽可能地防止网络训练进行局部极小点,解决了只有一个输入层的神经网络结构无法解决工程控制中具有前后顺序的参数影响产品加工的问题。

    基于MPP的并行数据挖掘架构及其方法

    公开(公告)号:CN104239555A

    公开(公告)日:2014-12-24

    申请号:CN201410497377.2

    申请日:2014-09-25

    Abstract: 本发明涉及一种基于MPP的并行数据挖掘架构及其方法,其主要技术特点是:该挖掘架构包括一个挖掘引擎节点和多个分布式的挖掘代理节点,该方法是:挖掘引擎节点将当前数据挖掘任务分配给数据挖掘任务负载较少的挖掘代理节点,将其作为该数据挖掘任务的Master挖掘代理节点;Master挖掘代理节点采用数据分布的负载均衡及就近挖掘策略并向挖掘代理节点分发挖掘任务;每个挖掘代理节点按照分配的子任务执行Slaver算子,每个Slaver算子只进行其分配到的数据块的处理。本发明采用MPP方法并结合数据挖掘的特点,实现对海量数据的高速有效地处理,解决了传统数据挖掘软件处理数据量小,运行速度慢的问题,大大提高了数据挖掘算法处理海量数据的效率和数据承载能力。

    基于MPP的并行数据挖掘系统及其实现方法

    公开(公告)号:CN104239555B

    公开(公告)日:2017-07-11

    申请号:CN201410497377.2

    申请日:2014-09-25

    Abstract: 本发明涉及一种基于MPP的并行数据挖掘系统及其实现方法,其主要技术特点是:该系统包括一个挖掘引擎节点和多个分布式的挖掘代理节点,该方法是:挖掘引擎节点将当前数据挖掘任务分配给数据挖掘任务负载较少的挖掘代理节点,将其作为该数据挖掘任务的Master挖掘代理节点;Master挖掘代理节点采用数据分布的负载均衡及就近挖掘策略并向挖掘代理节点分发挖掘任务;每个挖掘代理节点按照分配的子任务执行Slaver算子,每个Slaver算子只进行其分配到的数据块的处理。本发明采用MPP方法并结合数据挖掘的特点,实现对海量数据的高速有效地处理,解决了传统数据挖掘软件处理数据量小,运行速度慢的问题,大大提高了数据挖掘算法处理海量数据的效率和数据承载能力。

Patent Agency Ranking