用于处理点击行为数据的方法和装置

    公开(公告)号:CN110069691B

    公开(公告)日:2021-05-28

    申请号:CN201910352770.5

    申请日:2019-04-29

    Inventor: 苏晓东 刘广

    Abstract: 本申请实施例公开了用于处理点击行为数据的方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:获取预设类别的点击行为数据,点击行为数据包括点击的页面的地址以及执行点击操作的设备的设备标识,对预设类别的点击行为数据进行建模,生成表征设备标识与点击的页面的地址之间的点击关系的关系模型,基于关系模型对设备标识和页面的地址进行聚类,得到至少一个类簇,基于获取到的对至少一个类簇的搜索引擎优化行为检测结果,生成至少一个类簇中的页面的搜索引擎优化行为的类别信息。该实施方式实现了页面的搜索引擎优化行为的检测,并且能够提升搜索引擎优化行为检测的效率。

    用于确定目标页面的方法和装置

    公开(公告)号:CN110069693A

    公开(公告)日:2019-07-30

    申请号:CN201910352767.3

    申请日:2019-04-29

    Abstract: 本申请实施例公开了用于确定目标页面的方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:基于待检测页面集中的页面的域名,从待检测页面集中提取出满足预设条件的候选待检测页面,并添加至候选待检测页面队列;对候选待检测页面队列中的候选待检测页面执行查找目标页面的操作,查找目标页面的操作包括:对候选待检测页面进行类别判定,确定预设类别的候选待检测页面为目标页面,从目标页面的域名中提取出对应的一级域名,基于目标页面对应的一级域名爬取目标页面的关联页面,响应于确定目标页面的关联页面不在候选待检测页面队列中,将目标页面的关联页面添加至候选待检测页面队列中。该实施方式提升了目标页面的查找效率。

    用于处理点击行为数据的方法和装置

    公开(公告)号:CN110069691A

    公开(公告)日:2019-07-30

    申请号:CN201910352770.5

    申请日:2019-04-29

    Inventor: 苏晓东 刘广

    Abstract: 本申请实施例公开了用于处理点击行为数据的方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:获取预设类别的点击行为数据,点击行为数据包括点击的页面的地址以及执行点击操作的设备的设备标识,对预设类别的点击行为数据进行建模,生成表征设备标识与点击的页面的地址之间的点击关系的关系模型,基于关系模型对设备标识和页面的地址进行聚类,得到至少一个类簇,基于获取到的对至少一个类簇的搜索引擎优化行为检测结果,生成至少一个类簇中的页面的搜索引擎优化行为的类别信息。该实施方式实现了页面的搜索引擎优化行为的检测,并且能够提升搜索引擎优化行为检测的效率。

    用于确定目标页面的方法和装置

    公开(公告)号:CN110069693B

    公开(公告)日:2021-12-24

    申请号:CN201910352767.3

    申请日:2019-04-29

    Abstract: 本申请实施例公开了用于确定目标页面的方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:基于待检测页面集中的页面的域名,从待检测页面集中提取出满足预设条件的候选待检测页面,并添加至候选待检测页面队列;对候选待检测页面队列中的候选待检测页面执行查找目标页面的操作,查找目标页面的操作包括:对候选待检测页面进行类别判定,确定预设类别的候选待检测页面为目标页面,从目标页面的域名中提取出对应的一级域名,基于目标页面对应的一级域名爬取目标页面的关联页面,响应于确定目标页面的关联页面不在候选待检测页面队列中,将目标页面的关联页面添加至候选待检测页面队列中。该实施方式提升了目标页面的查找效率。

Patent Agency Ranking