一种海量数据聚类分析方法及装置

    公开(公告)号:CN110717086A

    公开(公告)日:2020-01-21

    申请号:CN201911270066.1

    申请日:2019-12-12

    Abstract: 本发明公开了一种海量数据聚类分析方法及装置,本发明的目的在于实现一种基于并行计算的DBSCAN算法,解决传统密度聚类算法无法进行海量数据分析的问题。该发明提出了高效的交叠分区和类簇合并策略,能够快速的进行数据拆分和类簇合并,并且该方法充分考虑了负载均衡,可以在分布式框架下实现高效运算,从而支持海量数据的聚类,高效地解决了传统DBSCAN无法进行海量数据分析的问题,因此该方法具有较高的性能和实用价值。

Patent Agency Ranking