-
公开(公告)号:CN116244614A
公开(公告)日:2023-06-09
申请号:CN202310070648.5
申请日:2023-02-06
Applicant: 南昌大学
IPC: G06F18/2321 , G06F18/214 , G06F17/18
Abstract: 本发明涉及数据挖掘技术领域,尤其涉及一种处理密度分布不均匀数据集的免参数聚类方法。根据自然邻居图算法将数据集划分出数据分片,并剔除全局离群点;给出噪声分片的定义,并将数据集中的噪声分片剔除;根据DBSCAN算法对每一个数据分片进行聚类,现实密度分布不均匀数据的聚类。本发明方法具备去除全局离群点和局部离群点的功能,有更好的抗噪性和鲁棒性;无需设定初始参数,可以根据不同的数据集调整中间参数,解决了参数难设定的问题;提供了一种处理密度分布不均匀数据集的聚类方法,实现了对密度不均匀数据集的自动聚类,并提高了聚类精度。