一种用于处理网页内容的方法和设备

    公开(公告)号:CN102314494B

    公开(公告)日:2014-04-02

    申请号:CN201110247492.0

    申请日:2011-08-24

    Abstract: 本发明的目的是提供一种用于处理网页内容的方法和设备,其中,本发明根据待处理的网页的相关信息,在特征文本库中进行匹配查询,以获得与所述网页相对应的特征文本,进而用于将所述特征文本在与所述网页相对应的DOM树的各节点中进行匹配查询,以获得包含所述特征文本的特征文本节点,从而根据所述特征文本节点中的特征节点内容,生成与所述网页相对应的新网页。与现有技术相比,本发明将网页中的特征文本在网页的DOM树中进行匹配查询,以提取包含特征文本的特征文本节点的内容,进而生成新的网页,其对于具有特定内容和结构特征的网页的处理效率高,同时,可对网页内容进行重新布局以满足用户的浏览需求,进而提升用户体验。

    一种用于处理网页内容的方法和设备

    公开(公告)号:CN102314494A

    公开(公告)日:2012-01-11

    申请号:CN201110247492.0

    申请日:2011-08-24

    Abstract: 本发明的目的是提供一种用于处理网页内容的方法和设备,其中,本发明根据待处理的网页的相关信息,在特征文本库中进行匹配查询,以获得与所述网页相对应的特征文本,进而用于将所述特征文本在与所述网页相对应的DOM树的各节点中进行匹配查询,以获得包含所述特征文本的特征文本节点,从而根据所述特征文本节点中的特征节点内容,生成与所述网页相对应的新网页。与现有技术相比,本发明将网页中的特征文本在网页的DOM树中进行匹配查询,以提取包含特征文本的特征文本节点的内容,进而生成新的网页,其对于具有特定内容和结构特征的网页的处理效率高,同时,可对网页内容进行重新布局以满足用户的浏览需求,进而提升用户体验。

Patent Agency Ranking