异常访问的检测方法、装置、电子设备及存储介质

    公开(公告)号:CN116232691A

    公开(公告)日:2023-06-06

    申请号:CN202310037949.8

    申请日:2023-01-10

    Abstract: 本公开提供了一种异常访问的检测方法、装置、电子设备及存储介质,涉及计算机技术领域,尤其涉及网络安全、反网络爬虫等技术领域。包括:接收客户端发送的访问请求,其中,访问请求中包含目标资源及客户端的标识;在目标资源为锚点资源库中的任一锚点资源的情况下,获取客户端的标识在第一时间段内对锚点资源库中的锚点资源的第一历史访问次数,其中,第一时间段位于接收访问请求的时刻之前;在第一历史访问次数大于第一阈值的情况下,禁止客户端的访问。由此,可以通过客户端访问网站中锚点资源的频次,确定异常访问的客户端,进而禁止异常访问的客户端的访问,从而可以准确地识别异常访问的客户端,避免异常访问的客户端大量获取网站资源。

    网页资源获取方法、装置、电子设备和存储介质

    公开(公告)号:CN116628306A

    公开(公告)日:2023-08-22

    申请号:CN202310124802.2

    申请日:2023-02-03

    Abstract: 本公开提供了一种网页资源获取方法、装置、电子设备以及存储介质,涉及大数据技术领域,尤其涉及智能搜索领域。具体实现方案为:在预设站点集合中,确定目标站点集合;在第一时间段内,采用第二地址段,获取所述目标站点集合中的网页资源;基于该第一时间段内获取网页资源的成功率,在该第一地址段和该第二地址段中确定目标地址段;采用该目标地址段,获取该预设站点集合中的各个网页资源。根据本公开,能够在多个地址段内进行择优适配,对网页资源进行多出口获取调度,可以尽可能地抓取预设站点集合中的全量资源,提升网页资源获取的覆盖度。

    一种相似站点识别方法、装置、电子设备和存储介质

    公开(公告)号:CN116108296A

    公开(公告)日:2023-05-12

    申请号:CN202310082978.6

    申请日:2023-01-19

    Abstract: 本公开提供了一种相似站点识别方法、装置、电子设备和存储介质,涉及计算机技术领域领域,尤其涉及智能搜索领域。具体实现方案为:查询待识别站点对应的目标记录信息,目标记录信息包括待识别站点对应的目标规范名称CNAME;从预设数据库中查找目标记录信息对应的关联站点,预设数据库中存储有多个记录信息,以及每个记录信息对应的至少一个站点;计算待识别站点和关联站点之间的相似度;若相似度大于预设阈值,则确定待识别站点与所述关联站点为相似站点。如此,可以简单快捷的识别相似站点,减少识别同质化网站的工作量。

Patent Agency Ranking