提取网页内容的方法、装置及系统

    公开(公告)号:CN104866512A

    公开(公告)日:2015-08-26

    申请号:CN201410067190.9

    申请日:2014-02-26

    CPC classification number: G06F17/272 G06F17/30011 G06F17/3089

    Abstract: 本发明涉及一种提取网页内容的方法、装置及系统,其方法包括:响应移动客户端在浏览器上触发的网页浏览指令,获取对应的网页;解析网页,获取网页脚本中标签的DOM节点;从DOM节点中获取插件标签节点;当插件标签节点对应的插件标签为预定类型标签时,提取插件标签对应的插件资源。本发明可在网页尚未真正渲染时完成符合特定协议规范的内容的提取,由此提高了网页预定内容的提取速度,同时也提高了网页的展示速度,此外,由于本方案可以不依赖后台服务器而是在浏览器终端侧实现插件资源的提取,在技术上易于实现,可降低开发成本。

Patent Agency Ranking