-
公开(公告)号:CN116232691A
公开(公告)日:2023-06-06
申请号:CN202310037949.8
申请日:2023-01-10
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04L9/40 , H04L41/142
Abstract: 本公开提供了一种异常访问的检测方法、装置、电子设备及存储介质,涉及计算机技术领域,尤其涉及网络安全、反网络爬虫等技术领域。包括:接收客户端发送的访问请求,其中,访问请求中包含目标资源及客户端的标识;在目标资源为锚点资源库中的任一锚点资源的情况下,获取客户端的标识在第一时间段内对锚点资源库中的锚点资源的第一历史访问次数,其中,第一时间段位于接收访问请求的时刻之前;在第一历史访问次数大于第一阈值的情况下,禁止客户端的访问。由此,可以通过客户端访问网站中锚点资源的频次,确定异常访问的客户端,进而禁止异常访问的客户端的访问,从而可以准确地识别异常访问的客户端,避免异常访问的客户端大量获取网站资源。
-
公开(公告)号:CN114172725A
公开(公告)日:2022-03-11
申请号:CN202111485889.3
申请日:2021-12-07
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04L9/40 , G06F16/958
Abstract: 本公开提供了一种非法网站的处理方法、装置、设备和存储介质,涉及计算机技术领域,尤其大数据技术领域。具体实现方案为:确定非法网站;基于网站之间的链接指向关系,确定非法网站的候选传播网站;根据所述候选传播网站进行分析,确定非法网站的源头传播网站。本公开实施例能够提高非法网站的处理效率。
-
公开(公告)号:CN114172725B
公开(公告)日:2023-11-14
申请号:CN202111485889.3
申请日:2021-12-07
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04L9/40 , G06F16/958
Abstract: 本公开提供了一种非法网站的处理方法、装置、设备和存储介质,涉及计算机技术领域,尤其大数据技术领域。具体实现方案为:确定非法网站;基于网站之间的链接指向关系,确定非法网站的候选传播网站;根据所述候选传播网站进行分析,确定非法网站的源头传播网站。本公开实施例能够提高非法网站的处理效率。
-
公开(公告)号:CN116628306A
公开(公告)日:2023-08-22
申请号:CN202310124802.2
申请日:2023-02-03
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/953 , G06F16/955
Abstract: 本公开提供了一种网页资源获取方法、装置、电子设备以及存储介质,涉及大数据技术领域,尤其涉及智能搜索领域。具体实现方案为:在预设站点集合中,确定目标站点集合;在第一时间段内,采用第二地址段,获取所述目标站点集合中的网页资源;基于该第一时间段内获取网页资源的成功率,在该第一地址段和该第二地址段中确定目标地址段;采用该目标地址段,获取该预设站点集合中的各个网页资源。根据本公开,能够在多个地址段内进行择优适配,对网页资源进行多出口获取调度,可以尽可能地抓取预设站点集合中的全量资源,提升网页资源获取的覆盖度。
-
公开(公告)号:CN116108296A
公开(公告)日:2023-05-12
申请号:CN202310082978.6
申请日:2023-01-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/955 , G06F16/22 , G06F18/22
Abstract: 本公开提供了一种相似站点识别方法、装置、电子设备和存储介质,涉及计算机技术领域领域,尤其涉及智能搜索领域。具体实现方案为:查询待识别站点对应的目标记录信息,目标记录信息包括待识别站点对应的目标规范名称CNAME;从预设数据库中查找目标记录信息对应的关联站点,预设数据库中存储有多个记录信息,以及每个记录信息对应的至少一个站点;计算待识别站点和关联站点之间的相似度;若相似度大于预设阈值,则确定待识别站点与所述关联站点为相似站点。如此,可以简单快捷的识别相似站点,减少识别同质化网站的工作量。
-
-
-
-