一种基于共享近邻的约束谱聚类方法

    公开(公告)号:CN108596234A

    公开(公告)日:2018-09-28

    申请号:CN201810342609.5

    申请日:2018-04-17

    Inventor: 丁世飞 王小玉

    Abstract: 本发明提出一种基于共享近邻的约束谱聚类方法,所要解决的问题是原约束谱聚类算法无法很好的处理密度分布不均的数据集。同时提高原算法在数据集上的聚类准确率。本发明包括以下步骤:1.计算样本对之间的欧氏距离,根据样本对的距离矩阵,求出数据对之间的共享近邻矩阵;2.根据样本对之间的欧氏距离和共享近邻矩阵计算相似矩阵;3.通过计算各行或各列的相似值之和,求出度矩阵;4.根据步骤2和步骤3求出的相似矩阵和度矩阵构造拉普拉斯矩阵;5.根据主动查询策略得出下一项要查询的约束项,并得出约束矩阵;6.由步骤4和步骤5算得的拉普拉斯矩阵和约束矩阵就可以算出我们的聚类分配向量,得出聚类结果;该方法不仅能够有效提高约束谱聚类算法的鲁棒性,很好地处理不同密度的数据集,并能有效的避免尺度参数敏感问题,具有很好的聚类效果。

    混合蛙跳算法的自适应核k‑means方法与系统

    公开(公告)号:CN106991442A

    公开(公告)日:2017-07-28

    申请号:CN201710201837.6

    申请日:2017-03-30

    CPC classification number: G06K9/6223

    Abstract: 本发明是一种混合蛙跳算法的自适应核k‑means方法与系统,涉及数据挖掘和聚类分析领域,特别涉及一种混合蛙跳算法的自适应核k‑means方法与系统。所要解决的问题是利用混合蛙跳算法优化核参数和聚类数,最后利用核k‑means得到有效的聚类结果。本发明包括以下步骤:首先导入数据,初始化青蛙种群。使用核k‑means进行聚类计算KBWP,将KBWP看作混合蛙跳算法的适应度。然后进行局部搜索及全局搜索,同时优化最差适应度的青蛙信息。最后当全局最优青蛙的适应度的相对改变小于预定义的值或迭代次数达到预定义的值,优化结束,输出聚类结果。基于混合蛙跳算法的自适应核k‑means能够根据数据集的内在结构能自动确定聚类数目和合适的核参数,最后得到有效的聚类结果。

Patent Agency Ranking