一种基于Hadoop的并行化SVM求解方法

    公开(公告)号:CN102750309B

    公开(公告)日:2015-06-17

    申请号:CN201210072523.8

    申请日:2012-03-19

    Abstract: 本发明公开了一种基于Hadoop的并行化SVM求解方法,包括如下步骤:将数据存储于分布式的集群文件系统中;根据数据的分布状况,在各个数据块上执行随机抽样过程,并将随机抽取的样本数据一一分配并形成若干的数据子集;在所述数据子集上进行局部第一方法;将各个数据子集上进行局部第一方法的结果进行取平均的融合,输出平均结果。本发明能够在不损失精度的情况下处理海量数据下的Pegasos求解,大大缩短运行时间,并且能够有好的拓展性。

    一种基于Hadoop的并行化SVM求解方法

    公开(公告)号:CN102750309A

    公开(公告)日:2012-10-24

    申请号:CN201210072523.8

    申请日:2012-03-19

    Abstract: 本发明公开了一种基于Hadoop的并行化SVM求解方法,包括如下步骤:将数据存储于分布式的集群文件系统中;根据数据的分布状况,在各个数据块上执行随机抽样过程,并将随机抽取的样本数据一一分配并形成若干的数据子集;在所述数据子集上进行局部第一方法;将各个数据子集上进行局部第一方法的结果进行取平均的融合,输出平均结果。本发明能够在不损失精度的情况下处理海量数据下的Pegasos求解,大大缩短运行时间,并且能够有好的拓展性。

Patent Agency Ranking