基于语义的改进的k-means算法的搜索方法

    公开(公告)号:CN109492022A

    公开(公告)日:2019-03-19

    申请号:CN201811091473.1

    申请日:2018-09-18

    Inventor: 暴建民 刘喆

    Abstract: 本发明提供一种基于语义的改进的k-means算法的搜索方法,对数据集进行预处理,得到初始聚类数量k、聚类数据集D,与初始聚类中心集合C:C1、C2、C3…、Cs作为输入;将数据集中的样本分配到输入入参最近的簇中;计算聚类的每个类的质心点,并判断聚类中心点的改变量是否满足设定的条件,若满足则将其加入特征集中,同时,将其中数据集中删除;若数据集样本不为空,则遍历中心点个数,数据集为空时,结束并获得聚类信息;通过使用UCI数据库提供的6个常用数据集,进行仿真实验,结果显示该种基于语义的改进的k-means算法的搜索方法,与现有技术相比,在数据迭代时间有所减少,聚类精度方面有所提高改善。

Patent Agency Ranking