面向海量数据的聚类方法及系统
    2.
    发明公开

    公开(公告)号:CN119782861A

    公开(公告)日:2025-04-08

    申请号:CN202411861898.1

    申请日:2024-12-17

    Abstract: 本发明提供了一种面向海量数据的聚类方法及系统,涉及数据技术领域,该方法包括将空间进行网格划分,并将所有数据点分配至对应的网格内,并创建边长为网格结构一半的子网格结构;构建网格索引并检索网格的邻居;在子网格结构中,通过对每个数据点的邻域进行遍历并计算距离,对海量数据的核心点进行识别;根据海量数据的核心点识别结果,进行核心网格的合并以及分配非核心点,完成面向海量数据的快速聚类。本发明解决了传统基于密度的聚类算法无法实现对海量规模数据集进行处理(特别是在参数MinPts较大时)的问题。

Patent Agency Ranking