一种网页裁剪方法及系统

    公开(公告)号:CN110020369B

    公开(公告)日:2021-05-11

    申请号:CN201711409030.8

    申请日:2017-12-22

    Abstract: 本发明提供一种网页裁剪方法和系统,所述方法包括:获取目标元素的唯一性标识,根据所述唯一性标识获取目标元素的裁剪规则集,基于所述裁剪规则集的裁剪规则顺序逐层提取网页内容,对所述唯一性标识对应的目标元素进行裁剪;其中,所述裁剪规则集中包括所述目标元素的唯一性标识,且所述唯一性标识为所述裁剪规则集的起点裁剪规则。通过用户点击或搜索匹配网页元素,根据规则检索函数自动生成该元素的裁剪规则集,将剪裁规则集按照统一格式存储,在后续应用集成时,通过裁剪工具按裁剪规则集指示流程便可最终获取网页元素。通过反向定位,在保证成功率的同时,最大限度地降低定位特定元素所需遍历的HTML节点,提高了裁剪的效率。

    一种网页裁剪方法及系统

    公开(公告)号:CN110020369A

    公开(公告)日:2019-07-16

    申请号:CN201711409030.8

    申请日:2017-12-22

    Abstract: 本发明提供一种网页裁剪方法和系统,所述方法包括:获取目标元素的唯一性标识,根据所述唯一性标识获取目标元素的裁剪规则集,基于所述裁剪规则集的裁剪规则顺序逐层提取网页内容,对所述唯一性标识对应的目标元素进行裁剪;其中,所述裁剪规则集中包括所述目标元素的唯一性标识,且所述唯一性标识为所述裁剪规则集的起点裁剪规则。通过用户点击或搜索匹配网页元素,根据规则检索函数自动生成该元素的裁剪规则集,将剪裁规则集按照统一格式存储,在后续应用集成时,通过裁剪工具按裁剪规则集指示流程便可最终获取网页元素。通过反向定位,在保证成功率的同时,最大限度地降低定位特定元素所需遍历的HTML节点,提高了裁剪的效率。

Patent Agency Ranking