一种大型网站的关键特征知识库的建立方法

    公开(公告)号:CN108900581A

    公开(公告)日:2018-11-27

    申请号:CN201810599236.X

    申请日:2018-06-12

    Abstract: 本发明公开了一种大型网站的关键特征知识库的建立方法,所述方法包括:采集大型互联网网站的主站点域名信息及其关联属性信息;采集大型互联网网站的网页形式及证书形式的子站点域名信息;将大型互联网网站的主站点域名和子站点域名进行关联,形成大型互联网网站的域名知识库;采集大型互联网网站的主站点域名、子站点域名对应的IP地址信息;将主站点域名IP、子站点域名IP进行集合归并,形成大型互联网网站的IP地址知识库。本发明解决现有的主动爬取方式无法对大型互联网网站的域名和IP信息进行有效刻划的问题。

    一种基于主被动数据的互联网接入网站数量的计算方法

    公开(公告)号:CN108880883B

    公开(公告)日:2021-11-05

    申请号:CN201810618363.X

    申请日:2018-06-15

    Abstract: 本发明公开了一种基于主被动数据的互联网接入网站数量的计算方法,所述方法包括:被动采集全国及各省互联网网站报备数据信息和IP地址报备信息,获得全国及各省互联网网站备案的域名信息、IP地址分布库;被动采集全国及各省活跃域名信息,获得全国及各省采集到的活跃域名信息;主动分布式采集以上两种方式采集的域名对应的网站信息,获得网站连接状态、标题、首页静态数据、接入IP地址信息;基于以上三类数据,通过数学建模,分析出全国及各省互联网网站的数量。本发明公开的统计方法能够在很大程度上反应全国互联网网站的总体数量情况、各省互联网网站的总体数量情况、所占比重情况,以及总体变化情况,具有较好的应用前景。

    一种基于主被动数据的互联网接入网站数量的计算方法

    公开(公告)号:CN108880883A

    公开(公告)日:2018-11-23

    申请号:CN201810618363.X

    申请日:2018-06-15

    Abstract: 本发明公开了一种基于主被动数据的互联网接入网站数量的计算方法,所述方法包括:被动采集全国及各省互联网网站报备数据信息和IP地址报备信息,获得全国及各省互联网网站备案的域名信息、IP地址分布库;被动采集全国及各省活跃域名信息,获得全国及各省采集到的活跃域名信息;主动分布式采集以上两种方式采集的域名对应的网站信息,获得网站连接状态、标题、首页静态数据、接入IP地址信息;基于以上三类数据,通过数学建模,分析出全国及各省互联网网站的数量。本发明公开的统计方法能够在很大程度上反应全国互联网网站的总体数量情况、各省互联网网站的总体数量情况、所占比重情况,以及总体变化情况,具有较好的应用前景。

Patent Agency Ranking