-
公开(公告)号:CN118379748A
公开(公告)日:2024-07-23
申请号:CN202410618763.6
申请日:2024-05-17
Applicant: 哈尔滨理工大学
Abstract: 本发明涉及一种基于深度神经网络的谱聚类方法。本发明首先对原始数据集进行预处理,对数据进行特征缩放操作,使不同特征之间的尺度保持一致。通过KNN对数据进行处理,得到数据点对。然后利用数据点对对Siamese网络进行训练,得到数据点之间的相似性度量;计算拉普拉斯矩阵,得到特征值和特征向量,利用特征向量对自组织映射神经网络进行训练,得到自组织映射神经网络的权值,在训练完成的模型上进行聚类,得到聚类结果;利用MNIST数据集进行测试,验证了该方法的有效性,本发明能够有效地捕捉到数据的内在特征和潜在规律,提高了聚类的准确率和可靠性,同时也增强了模型对不同类型数据的适应性和泛化能力,为数据分析和处理提供了更有力的支持和保障。此外还可以将高维数据映射到二维或三维的拓扑结构上,使得聚类结果可以通过可视化方式呈现,从而提升了整体系统的性能。
-
公开(公告)号:CN118211134A
公开(公告)日:2024-06-18
申请号:CN202410240864.4
申请日:2024-03-02
Applicant: 哈尔滨理工大学
IPC: G06F18/2413 , G06F18/23 , G06F18/10 , G06F16/901
Abstract: 本发明涉及一种基于加权局部异常因子的K‑近邻聚类算法。本发明首先对LO算法做出改进,利用改进规则为数据赋予权重,并做归一化处理,使数值范围在(0,1)之间;再根据加权局部离群因子LOF的值找出数据异常点。最终对正常点的数据进行K‑近邻聚类。利用UCI数据库中的6组标准版公开数据集进行测试,验证了该方法可以有效降提高谁选异常点,提高K‑近邻算法精度。本发明更准确分析了数据集原始分布情况,降低了样本间的冗余性,从而提高了分类器的性能。
-