一种用于处理页面数据的方法与设备

    公开(公告)号:CN103294781B

    公开(公告)日:2016-12-28

    申请号:CN201310177865.0

    申请日:2013-05-14

    Abstract: 本发明的目的是提供一种用于处理页面数据的方法与设备,具体地,获取待处理的目标页面;根据与所述目标页面的页面类型相对应的多个属性分类模型,确定所述目标页面中的页面节点的节点属性信息;根据所述节点属性信息,对所述页面节点进行相应的数据处理。其中,与现有技术相比,本发明通过根据与待处理的目标页面的页面类型相对应的多个属性分类模型,确定所述目标页面中的页面节点的节点属性信息,进而根据所述节点属性信息,对所述页面节点进行相应的数据处理,实现了根据页面类型对应的多个属性分类模型来提取页面数据,不依赖于页面类型的站点数,提高了提取页面数据的效率。

    一种用于处理页面数据的方法与设备

    公开(公告)号:CN103294781A

    公开(公告)日:2013-09-11

    申请号:CN201310177865.0

    申请日:2013-05-14

    Abstract: 本发明的目的是提供一种用于处理页面数据的方法与设备,具体地,获取待处理的目标页面;根据与所述目标页面的页面类型相对应的多个属性分类模型,确定所述目标页面中的页面节点的节点属性信息;根据所述节点属性信息,对所述页面节点进行相应的数据处理。其中,与现有技术相比,本发明通过根据与待处理的目标页面的页面类型相对应的多个属性分类模型,确定所述目标页面中的页面节点的节点属性信息,进而根据所述节点属性信息,对所述页面节点进行相应的数据处理,实现了根据页面类型对应的多个属性分类模型来提取页面数据,不依赖于页面类型的站点数,提高了提取页面数据的效率。

Patent Agency Ranking