-
公开(公告)号:CN103077228A
公开(公告)日:2013-05-01
申请号:CN201310000406.5
申请日:2013-01-02
Applicant: 北京科技大学
IPC: G06F17/30
Abstract: 本发明提供一种基于集合特征向量的快速聚类方法和装置。所述方法有如下步骤:1)将输入的混合属性数据转化为二值属性;2)按照对象稀疏性指数或不干涉序列指数排序;3)令排序后的第一个对象单独成类,得到其集合特征向量,然后顺序扫描其余待聚类对象,由当前扫描到的对象并入已经创建类的集合差异度与集合差异度上限b1的大小决定该对象是并入某个已经创建的类中还是单独创建一个新类;4)对步骤3)得到的初次聚类结果进行二次聚类,然后去除聚类结果中的孤立点,得到最终聚类结果。本发明只需要对数据进行一次排序和一次扫描即可完成聚类过程,兼顾聚类质量的同时,大幅降低了聚类所需的时间,而且聚类结果可以不受数据输入顺序的影响。
-
公开(公告)号:CN103077228B
公开(公告)日:2016-03-02
申请号:CN201310000406.5
申请日:2013-01-02
Applicant: 北京科技大学
IPC: G06F17/30
Abstract: 本发明提供一种基于集合特征向量的快速聚类方法和装置。所述方法有如下步骤:1)将输入的混合属性数据转化为二值属性;2)按照对象稀疏性指数或不干涉序列指数排序;3)令排序后的第一个对象单独成类,得到其集合特征向量,然后顺序扫描其余待聚类对象,由当前扫描到的对象并入已经创建类的集合差异度与集合差异度上限b1的大小决定该对象是并入某个已经创建的类中还是单独创建一个新类;4)对步骤3)得到的初次聚类结果进行二次聚类,然后去除聚类结果中的孤立点,得到最终聚类结果。本发明只需要对数据进行一次排序和一次扫描即可完成聚类过程,兼顾聚类质量的同时,大幅降低了聚类所需的时间,而且聚类结果可以不受数据输入顺序的影响。
-