一种基于网络流量多字段识别的人流量检测方法及系统

    公开(公告)号:CN106878102B

    公开(公告)日:2020-05-22

    申请号:CN201611204278.6

    申请日:2016-12-23

    Abstract: 本发明提供一种基于网络流量多字段识别的人流量检测方法,步骤包括:1)获取网络流量,对所含的数据包进行预处理,包括IP碎片重组、链接还原和协议识别;2)识别预处理后的数据包所含的多字段信息,该多字段信息包括基准字段、设备指纹字段、位置信息和时间戳信息;3)将多字段信息填充于设备表中;4)通过检测设备表中的联网设备位置信息和时间戳信息来统计人流量。本发明还提供一种基于网络流量多字段识别的人流量检测系统,包括流量获取模块、数据预处理模块、多字段识别模块、设备表模块及人流量统计模块。

    一种基于被动DNS流量的递归域名服务器用户量估计方法

    公开(公告)号:CN112866039A

    公开(公告)日:2021-05-28

    申请号:CN202110254552.5

    申请日:2021-03-05

    Abstract: 本发明提出一种基于被动DNS流量的递归域名服务器用户量估计方法,涉及网络测量技术领域,通过分析被动DNS流量,能够实现在经过NAT地址转换无法获取用户真实源IP地址,以及经过递归域名服务器RDNS缓存压缩后用户原始DNS请求包数量减少的真实网络场景下,估计使用该递归域名服务器的所有用户量范围。利用RDNS缓存压缩后的DNS请求包计算RDNS内部用户量下界。利用RDNS缓存压缩后的DNS请求包和响应包,把由该RDNS缓存压缩后的DNS请求包变成内部用户发起的模拟DNS请求包,然后利用生成的模拟DNS请求包计算RDNS内部用户量上界。通过本方法得到的估计用户量与真实用户量的偏差范围较小,效果优异。

    基于主被动结合的音视频网站用户入口标识方法及系统

    公开(公告)号:CN112347334A

    公开(公告)日:2021-02-09

    申请号:CN202011001392.5

    申请日:2020-09-22

    Abstract: 本发明公开一种主被动结合的音视频网站用户入口标识方法及系统,属于互联网信息技术领域,通过用户输入的域名查询全局节目标识表中是否存在该域名,如果不存在,则获取域名网站主页的候选子页面URL;通过主动访问,判断页面中是否存在音视频节目,提取所有包含音视频节目的子页面URL;根据候选子页面URL的数量及其与包含音视频节目的子页面URL的数量占比关系,判断该网站是否为音视频网站;如果是音视频网站,则获得节目标识,并将网站信息和节目标识更新至全局节目标识表中;如果不是,则将该网站信息更新至全局节目标识表中;将是否为音视频网站和音视频网站的节目标识作为查询结果返回给用户。

    一种压缩网页指纹库构建方法和压缩网页快速相似性匹配方法

    公开(公告)号:CN107679073A

    公开(公告)日:2018-02-09

    申请号:CN201710742190.8

    申请日:2017-08-25

    Abstract: 本发明涉及一种压缩网页指纹库构建方法和压缩网页快速相似性匹配方法。该方法包括:对Gzip压缩网页进行霍夫曼解码,得到半解压缩网页;对半解压缩网页进行分词处理,并选取能够表征网页的分词作为特征分词;对网页的特征分词进行降维处理,生成一维的指纹信息;根据网页的指纹信息构建指纹库;对在线的Gzip压缩网页采用同样方法生成一维的指纹信息,并与Gzip压缩网页的指纹库中的指纹进行相似性比较,根据设定的相似度阈值判定是否相似。采用本发明的方法进行压缩网页的相似性匹配,能够有效地提高压缩网页的相似性匹配的效率。

    基于主被动结合的音视频网站用户入口标识方法及系统

    公开(公告)号:CN112347334B

    公开(公告)日:2023-05-23

    申请号:CN202011001392.5

    申请日:2020-09-22

    Abstract: 本发明公开一种主被动结合的音视频网站用户入口标识方法及系统,属于互联网信息技术领域,通过用户输入的域名查询全局节目标识表中是否存在该域名,如果不存在,则获取域名网站主页的候选子页面URL;通过主动访问,判断页面中是否存在音视频节目,提取所有包含音视频节目的子页面URL;根据候选子页面URL的数量及其与包含音视频节目的子页面URL的数量占比关系,判断该网站是否为音视频网站;如果是音视频网站,则获得节目标识,并将网站信息和节目标识更新至全局节目标识表中;如果不是,则将该网站信息更新至全局节目标识表中;将是否为音视频网站和音视频网站的节目标识作为查询结果返回给用户。

    一种基于网络流量多字段识别的人流量检测方法及系统

    公开(公告)号:CN106878102A

    公开(公告)日:2017-06-20

    申请号:CN201611204278.6

    申请日:2016-12-23

    Abstract: 本发明提供一种基于网络流量多字段识别的人流量检测方法,步骤包括:1)获取网络流量,对所含的数据包进行预处理,包括IP碎片重组、链接还原和协议识别;2)识别预处理后的数据包所含的多字段信息,该多字段信息包括基准字段、设备指纹字段、位置信息和时间戳信息;3)将多字段信息填充于设备表中;4)通过检测设备表中的联网设备位置信息和时间戳信息来统计人流量。本发明还提供一种基于网络流量多字段识别的人流量检测系统,包括流量获取模块、数据预处理模块、多字段识别模块、设备表模块及人流量统计模块。

Patent Agency Ranking