基于转发关系的微博聚类方法

    公开(公告)号:CN105159905B

    公开(公告)日:2019-08-30

    申请号:CN201510325890.8

    申请日:2015-06-12

    Abstract: 本发明公开了基于转发关系的微博聚类方法,该方法针对微博文本特征稀疏造成的微博文本聚类效果不佳的问题,提出一种基于微博转发关系的微博文本聚类方法。该方法根据微博之间存在的转发关系以及转发文本之间的主题相似性,构建了微博转发关系有向图。该图将转发关系作为单向边,使用微博作为节点构成图,将相互连通的部分视作一个小簇,称之为转发关系簇,在这个小簇中所有微博有同一个最初的转发源。本发明方法将转发关系簇作为聚类的初始对象,采用基于最大最小距离和SSE的自适应聚类算法进行微博文本聚类,提高了文本特征稀疏的微博文本的聚类准确率。

    基于转发关系的微博聚类方法

    公开(公告)号:CN105159905A

    公开(公告)日:2015-12-16

    申请号:CN201510325890.8

    申请日:2015-06-12

    Abstract: 本发明公开了基于转发关系的微博聚类方法,该方法针对微博文本特征稀疏造成的微博文本聚类效果不佳的问题,提出一种基于微博转发关系的微博文本聚类方法。该方法根据微博之间存在的转发关系以及转发文本之间的主题相似性,构建了微博转发关系有向图。该图将转发关系作为单向边,使用微博作为节点构成图,将相互连通的部分视作一个小簇,称之为转发关系簇,在这个小簇中所有微博有同一个最初的转发源。本发明方法将转发关系簇作为聚类的初始对象,采用基于最大最小距离和SSE的自适应聚类算法进行微博文本聚类,提高了文本特征稀疏的微博文本的聚类准确率。

Patent Agency Ranking