一种获取搜索引擎搜索结果的方法和装置

    公开(公告)号:CN106970962A

    公开(公告)日:2017-07-21

    申请号:CN201710170469.3

    申请日:2017-03-21

    CPC classification number: G06F16/95 G06F16/951

    Abstract: 本发明公开了一种获取搜索引擎搜索结果的方法和装置。所述方法包括:输入待测试的搜索引擎、关键词和页码;将关键词和页码输入搜索引擎对应的搜索引擎模板,获得关键词和页码对应的一级页面地址;将一级页面地址输入到预设的浏览器中,通过浏览器访问一级页面地址,并获取一级页面地址对应一级页面信息和二级页面信息。本发明采用自动化的方式获取搜索引擎的搜索结果,通过预先设置搜索引擎模板的方式,自动获得一级页面地址,并将一级页面地址输入预设的浏览器中,进而通过访问该一级页面地址,自动获得所需的一级页面信息和二级页面信息。通过本发明可以有效提升搜索验证效率和准确率,提高搜索效果以及获得搜索结果的效率。

    一种动态URL过滤方法及装置

    公开(公告)号:CN104573033A

    公开(公告)日:2015-04-29

    申请号:CN201510020876.7

    申请日:2015-01-15

    CPC classification number: G06F17/30876 G06F17/30887

    Abstract: 本发明提出了一种动态URL过滤方法及装置,该方法包括:基于URL标注集创建信息字典;针对URL标注集中的每一个URL,根据所述信息字典生成对应的特征向量,由URL标注集中所有的URL对应的特征向量组成特征矩阵;对URL特征矩阵进行分类得到特征权重向量和二分类阈值;基于所述信息字段对待预测的URL进行特征提取,并基于提取出的特征生成所述待预测的URL的特征向量;将所述待预测的URL的特征向量与所述特征权重向量对应相乘后相加得到目标数值,将目标数值与二分类阈值相比较以判断所述待预测的URL是动态URL还是静态URL。本发明可以离线处理,不需要访问网络、减少了存储,比较节省处理时间和计算资源。

    一种SDK隐私函数调用管控方法、设备、介质及产品

    公开(公告)号:CN118012541B

    公开(公告)日:2024-06-25

    申请号:CN202410423861.4

    申请日:2024-04-10

    Abstract: 本发明提供了一种SDK隐私函数调用管控方法、设备、介质及产品,涉及隐私函数调用领域,方法包括:采用字节码遍历解析模块遍历App中所有字节码文件,解析每个字节码文件,确定属性和函数信息;利用隐私函数管控设置模块构建隐私函数管控列表文件;利用违规调用系统函数代码发现模块将所述属性和函数信息与隐私函数管控列表文件进行逐一比对,筛选出违规调用系统隐私函数接口的函数;利用违规调用系统函数替换修改模块将已发现的违规调用系统隐私函数接口的函数进行修改,并替换为合规收口函数;在所述合规收口函数中添加管控逻辑,对需要管控的SDK违规隐私函数调用行为进行管控。本发明能够规范SDK系统隐私函数访问行为。

    基于流计算的大规模数据处理方法及装置

    公开(公告)号:CN115269218A

    公开(公告)日:2022-11-01

    申请号:CN202210691674.5

    申请日:2022-06-17

    Abstract: 本发明提供了一种基于流计算的大规模数据处理方法及装置,所述方法包括:建立数据提供方与数据处理方之间的HTTP服务,所述HTTP服务将HTTP协议消息体中的数据转换为二进制数据包;将二进制数据包发送到Kafka消息队列;在Flink计算框架的构造消费者程序的流程中创建一个反序列化器,以构建新Flink计算框架;基于所述新Flink计算框架,对所述Kafka消息队列进行数据处理,以得到数据处理结果。本发明降低流数据处理系统的数据接入难度,提高整个数据处理系统的吞吐量。

    基于特定企业域名数据的用户及服务器IP地址标定装置及方法

    公开(公告)号:CN110324327B

    公开(公告)日:2021-07-13

    申请号:CN201910537333.0

    申请日:2019-06-20

    Abstract: 本发明提出一种基于特定企业域名数据的用户及服务器IP地址标定装置及方法,属于通信技术领域。本发明装置在处理机上设置有数据采集、清理、存储模块、流数据处理模块、域名数据处理模块、融合标定模块等。本发明方法采集企业私有路由的流数据和私有DNS域名数据,进行清理和存储后,分别对两部分数据根据提取的IP行为特征计算IP类型与置信度,分别存入两个标定库中,对两个标定库中均有的IP进行融合标定,然后流量分析和监管时,根据标定的类型进行流量处理、白名单设置等。本发明标定速度快,可实现实时标定,标定结果准确,为后面流量分析和监控提供有力数据基础。

    一种分析微信公众号小程序收集信息的方法

    公开(公告)号:CN112256959A

    公开(公告)日:2021-01-22

    申请号:CN202011044049.9

    申请日:2020-09-28

    Abstract: 本发明提供了一种分析微信公众号小程序收集信息的方法,属于网络数据分析技术领域。本发明采用一个自动化信息采集工具进行用户信息采集,所述工具包括自动模拟点击模块、界面识别模块、模拟登录模块、流量捕获解析模块、界面解析模块以及收集信息分析模块。本发明采用模拟器和界面布局识别的方式,对微信进行自动模拟操作、模拟登录,以及所有事件和界面进行点击和爬取,对界面进行识别分析,获取收集用户信息情况。本发明实现了对公众号以及小程序收集信息的自动化分析处理,可以节省大量的人力资源,并且还可以高效准确的对数据进行分类,发现应用收集的信息。

    一种获取搜索引擎搜索结果的方法和装置

    公开(公告)号:CN106970962B

    公开(公告)日:2020-08-11

    申请号:CN201710170469.3

    申请日:2017-03-21

    Abstract: 本发明公开了一种获取搜索引擎搜索结果的方法和装置。所述方法包括:输入待测试的搜索引擎、关键词和页码;将关键词和页码输入搜索引擎对应的搜索引擎模板,获得关键词和页码对应的一级页面地址;将一级页面地址输入到预设的浏览器中,通过浏览器访问一级页面地址,并获取一级页面地址对应一级页面信息和二级页面信息。本发明采用自动化的方式获取搜索引擎的搜索结果,通过预先设置搜索引擎模板的方式,自动获得一级页面地址,并将一级页面地址输入预设的浏览器中,进而通过访问该一级页面地址,自动获得所需的一级页面信息和二级页面信息。通过本发明可以有效提升搜索验证效率和准确率,提高搜索效果以及获得搜索结果的效率。

    基于特定企业域名数据的用户及服务器IP地址标定装置及方法

    公开(公告)号:CN110324327A

    公开(公告)日:2019-10-11

    申请号:CN201910537333.0

    申请日:2019-06-20

    Abstract: 本发明提出一种基于特定企业域名数据的用户及服务器IP地址标定装置及方法,属于通信技术领域。本发明装置在处理机上设置有数据采集、清理、存储模块、流数据处理模块、域名数据处理模块、融合标定模块等。本发明方法采集企业私有路由的流数据和私有DNS域名数据,进行清理和存储后,分别对两部分数据根据提取的IP行为特征计算IP类型与置信度,分别存入两个标定库中,对两个标定库中均有的IP进行融合标定,然后流量分析和监管时,根据标定的类型进行流量处理、白名单设置等。本发明标定速度快,可实现实时标定,标定结果准确,为后面流量分析和监控提供有力数据基础。

Patent Agency Ranking