一种基于功能区域识别的网页切分方法及装置

    公开(公告)号:CN103440239B

    公开(公告)日:2016-08-10

    申请号:CN201310176551.9

    申请日:2013-05-14

    Abstract: 公开了一种基于功能区域识别的网页切分方法及装置。所述方法包括:针对网页生成文档对象模型(DOM)树,DOM树包括用于网页展示的内容;提取DOM树节点的位置信息和大小信息;解析出层叠样式表(CSS)属性中的边界边缘属性和栏外空白区属性;利用网页分块标注算法对网页进行标注,以标注出功能和语义区,并将标注的块标记为粒度候选;根据DOM树结构在剩余网页中扫描图文混排块,将扫描出的图文混排块标记为粒度候选;扫描剩余的块,如果扫描出的块的边界边缘属性和栏外空白区属性不为0,则将所述块标记为粒度候选;将DOM树中剩余没有标记的块标记为粒度候选。

    一种确定网页图片相关度及显示检索结果的方法及装置

    公开(公告)号:CN104063489A

    公开(公告)日:2014-09-24

    申请号:CN201410317567.1

    申请日:2014-07-04

    CPC classification number: G06F16/951 G06F16/532

    Abstract: 本发明实施例公开了一种确定网页图片相关度及显示检索结果的方法及装置,所述确定网页图片相关度的方法包括:获取目标网页中的图片;根据图片在目标网页中的位置、图片的周边信息和图片与目标网页主题的相关度中的至少一项,确定图片与目标网页的相关度;根据图片与目标网页之间的相关度,建立网页图片信息索引库。通过本发明公开的一种确定网页图片相关度及显示检索结果的方法及装置,可以确定图片与所述目标网页之间的相关度,建立网页图片信息索引库,并且在检索结果中显示网页主图,使得用户通过网页主图直观的获得页面主题,判断该页面是否是正确的检索结果,提高了用户检索的效率。

    搜索结果的提供方法和装置

    公开(公告)号:CN103927380A

    公开(公告)日:2014-07-16

    申请号:CN201410175750.2

    申请日:2014-04-28

    CPC classification number: G06F17/30864 G06F17/30902

    Abstract: 本发明提出一种搜索结果的提供方法和装置。该方法包括:接收用户输入的搜索词,并根据搜索词获得搜索结果;对搜索词进行分析以确定搜索词对应的图片展现需求信息;根据图片展现需求信息在预先建立的图片数据库中查询搜索结果对应的网页是否存在代表图片,代表图片是根据对应网页的站长发布的数据所提取的;向用户展现搜索结果,其中,当搜索结果对应的网页存在代表图片时,向用户展现所述代表图片。本发明实施例的方法,向用户展现的代表图片最新、更有权威性;另外,由于站长发布的数据的规范性,在获取代表图片时更加简捷、快速、准确、维护成本低,不容易失效,而且适合任何网页。

    一种基于功能区域识别的网页切分方法及装置

    公开(公告)号:CN103440239A

    公开(公告)日:2013-12-11

    申请号:CN201310176551.9

    申请日:2013-05-14

    Abstract: 公开了一种基于功能区域识别的网页切分方法及装置。所述方法包括:针对网页生成文档对象模型(DOM)树,DOM树包括用于网页展示的内容;提取DOM树节点的位置信息和大小信息;解析出层叠样式表(CSS)属性中的边界边缘属性和栏外空白区属性;利用网页分块标注算法对网页进行标注,以标注出功能和语义区,并将标注的块标记为粒度候选;根据DOM树结构在剩余网页中扫描图文混排块,将扫描出的图文混排块标记为粒度候选;扫描剩余的块,如果扫描出的块的边界边缘属性和栏外空白区属性不为0,则将所述块标记为粒度候选;将DOM树中剩余没有标记的块标记为粒度候选。

    搜索结果的提供方法和装置

    公开(公告)号:CN103927380B

    公开(公告)日:2018-11-20

    申请号:CN201410175750.2

    申请日:2014-04-28

    Abstract: 本发明提出一种搜索结果的提供方法和装置。该方法包括:接收用户输入的搜索词,并根据搜索词获得搜索结果;对搜索词进行分析以确定搜索词对应的图片展现需求信息;根据图片展现需求信息在预先建立的图片数据库中查询搜索结果对应的网页是否存在代表图片,代表图片是根据对应网页的站长发布的数据所提取的;向用户展现搜索结果,其中,当搜索结果对应的网页存在代表图片时,向用户展现所述代表图片。本发明实施例的方法,向用户展现的代表图片最新、更有权威性;另外,由于站长发布的数据的规范性,在获取代表图片时更加简捷、快速、准确、维护成本低,不容易失效,而且适合任何网页。

Patent Agency Ranking