Spark下基于标签传播的并行重叠社区发现方法

    公开(公告)号:CN106991614A

    公开(公告)日:2017-07-28

    申请号:CN201710121328.2

    申请日:2017-03-02

    Abstract: 本发明提供一种Spark下基于标签传播的并行社区发现方法,涉及数据挖掘领域。本发明在网络中寻找完全子图,将完全子图中的节点赋予相同的标签,以此来减少初始化阶段标签过多的缺点,提高了算法的执行效率;其次根据节点的权重计算网络中节点的传播概率,在标签选择阶段综合考虑了标签传播概率以及节点间的相似性,提高了标签选择阶段的准确度;整个算法是在Spark框架下执行的,对于海量数据具有很好的可扩展性,本发明在执行效率以及准确度都有明显的提高,社区发现的质量也有很大的提升。

Patent Agency Ranking