一种基于列划分的分布式机器学习优化的分类方法及装置

    公开(公告)号:CN110929884B

    公开(公告)日:2023-05-16

    申请号:CN201911156466.X

    申请日:2019-11-22

    Applicant: 北京大学

    Abstract: 本发明公布了一种列划分的分布式机器学习优化的分类方法和装置,采用基于列划分的分布式随机梯度下降SGD方法,称为ColumnSGD,对多维度序列数据进行分类;所述多维度序列数据包括基因序列数据;所述ColumnSGD方法包括:建立分布式机器学习系统的容错机制、建立基于列划分的分布式SGD模型,通过采用将行划分数据转换为列划分数据的高效算法,并基于梯度编码提出模型掉队者问题的解决方法,实现高效分类。本发明通过采用基于列划分的结构,利用列式划分特性、分布式特性,计算模型梯度;能减少分布式机器学习系统的通讯开销及存储开销,提高计算速度,从而提高分类的效率。

    一种基于列划分的分布式机器学习优化的分类方法及装置

    公开(公告)号:CN110929884A

    公开(公告)日:2020-03-27

    申请号:CN201911156466.X

    申请日:2019-11-22

    Applicant: 北京大学

    Abstract: 本发明公布了一种列划分的分布式机器学习优化的分类方法和装置,采用基于列划分的分布式随机梯度下降SGD方法,称为ColumnSGD,对多维度序列数据进行分类;所述多维度序列数据包括基因序列数据;所述ColumnSGD方法包括:建立分布式机器学习系统的容错机制、建立基于列划分的分布式SGD模型,通过采用将行划分数据转换为列划分数据的高效算法,并基于梯度编码提出模型掉队者问题的解决方法,实现高效分类。本发明通过采用基于列划分的结构,利用列式划分特性、分布式特性,计算模型梯度;能减少分布式机器学习系统的通讯开销及存储开销,提高计算速度,从而提高分类的效率。

Patent Agency Ranking