-
公开(公告)号:CN110069691B
公开(公告)日:2021-05-28
申请号:CN201910352770.5
申请日:2019-04-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/951
Abstract: 本申请实施例公开了用于处理点击行为数据的方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:获取预设类别的点击行为数据,点击行为数据包括点击的页面的地址以及执行点击操作的设备的设备标识,对预设类别的点击行为数据进行建模,生成表征设备标识与点击的页面的地址之间的点击关系的关系模型,基于关系模型对设备标识和页面的地址进行聚类,得到至少一个类簇,基于获取到的对至少一个类簇的搜索引擎优化行为检测结果,生成至少一个类簇中的页面的搜索引擎优化行为的类别信息。该实施方式实现了页面的搜索引擎优化行为的检测,并且能够提升搜索引擎优化行为检测的效率。
-
公开(公告)号:CN114172725A
公开(公告)日:2022-03-11
申请号:CN202111485889.3
申请日:2021-12-07
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04L9/40 , G06F16/958
Abstract: 本公开提供了一种非法网站的处理方法、装置、设备和存储介质,涉及计算机技术领域,尤其大数据技术领域。具体实现方案为:确定非法网站;基于网站之间的链接指向关系,确定非法网站的候选传播网站;根据所述候选传播网站进行分析,确定非法网站的源头传播网站。本公开实施例能够提高非法网站的处理效率。
-
公开(公告)号:CN114172725B
公开(公告)日:2023-11-14
申请号:CN202111485889.3
申请日:2021-12-07
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04L9/40 , G06F16/958
Abstract: 本公开提供了一种非法网站的处理方法、装置、设备和存储介质,涉及计算机技术领域,尤其大数据技术领域。具体实现方案为:确定非法网站;基于网站之间的链接指向关系,确定非法网站的候选传播网站;根据所述候选传播网站进行分析,确定非法网站的源头传播网站。本公开实施例能够提高非法网站的处理效率。
-
公开(公告)号:CN110069693A
公开(公告)日:2019-07-30
申请号:CN201910352767.3
申请日:2019-04-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/953
Abstract: 本申请实施例公开了用于确定目标页面的方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:基于待检测页面集中的页面的域名,从待检测页面集中提取出满足预设条件的候选待检测页面,并添加至候选待检测页面队列;对候选待检测页面队列中的候选待检测页面执行查找目标页面的操作,查找目标页面的操作包括:对候选待检测页面进行类别判定,确定预设类别的候选待检测页面为目标页面,从目标页面的域名中提取出对应的一级域名,基于目标页面对应的一级域名爬取目标页面的关联页面,响应于确定目标页面的关联页面不在候选待检测页面队列中,将目标页面的关联页面添加至候选待检测页面队列中。该实施方式提升了目标页面的查找效率。
-
公开(公告)号:CN110069691A
公开(公告)日:2019-07-30
申请号:CN201910352770.5
申请日:2019-04-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/951
Abstract: 本申请实施例公开了用于处理点击行为数据的方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:获取预设类别的点击行为数据,点击行为数据包括点击的页面的地址以及执行点击操作的设备的设备标识,对预设类别的点击行为数据进行建模,生成表征设备标识与点击的页面的地址之间的点击关系的关系模型,基于关系模型对设备标识和页面的地址进行聚类,得到至少一个类簇,基于获取到的对至少一个类簇的搜索引擎优化行为检测结果,生成至少一个类簇中的页面的搜索引擎优化行为的类别信息。该实施方式实现了页面的搜索引擎优化行为的检测,并且能够提升搜索引擎优化行为检测的效率。
-
公开(公告)号:CN110069693B
公开(公告)日:2021-12-24
申请号:CN201910352767.3
申请日:2019-04-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/953
Abstract: 本申请实施例公开了用于确定目标页面的方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:基于待检测页面集中的页面的域名,从待检测页面集中提取出满足预设条件的候选待检测页面,并添加至候选待检测页面队列;对候选待检测页面队列中的候选待检测页面执行查找目标页面的操作,查找目标页面的操作包括:对候选待检测页面进行类别判定,确定预设类别的候选待检测页面为目标页面,从目标页面的域名中提取出对应的一级域名,基于目标页面对应的一级域名爬取目标页面的关联页面,响应于确定目标页面的关联页面不在候选待检测页面队列中,将目标页面的关联页面添加至候选待检测页面队列中。该实施方式提升了目标页面的查找效率。
-
-
-
-
-