一种面向主流微博网站微博ID的采集方法及工具

    公开(公告)号:CN103440139A

    公开(公告)日:2013-12-11

    申请号:CN201310412348.7

    申请日:2013-09-11

    Abstract: 一种面向主流微博网站微博ID的采集方法及工具,系统架构分为两个层次,分别为采集层和存储层,层次和系统间的接口清晰,每层内部都由若干模块组成,模块之间的松耦合,有利于每层功能的扩展。采集层实现认证用户微博ID的爬取以及长期的认证用户粉丝ID的采集;存储层实现将微博ID在本地进行数据库存储,并对外提供开放式的微博ID检索功能。该系统的用户可以是任何基于微博数据的第三方应用的开发人员,利用该系统提供的微博ID进行进一步的微博内容抓取、分析等相关第三方应用的开发;也可以是微博网站的管理人员,利用该系统提供的微博ID进行相关统计,从而对微博相关指标进行分析,如微博活跃程度分析、微博影响力分析等。

Patent Agency Ranking