-
公开(公告)号:CN100447793C
公开(公告)日:2008-12-31
申请号:CN200710019543.8
申请日:2007-01-10
Applicant: 苏州大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于视觉特征的页面查询接口抽取方法,首先获取一个包含查询接口的页面文档;采用基于视觉的文档分割方法,对上述页面文档构建视觉块树;定位查询接口区域;利用视觉特征识别标签块;再利用视觉特征完成控件块与标签块的分组,由此确定查询接口中的控件及其对应的属性标签,实现查询接口的自动抽取。本发明可以实现查询接口的自动抽取,为进行深层网页的集成搜索提供了基础;实验证明,本发明的基于视觉特征的查询接口自动抽取方法是可行的,并且具有较高的精度;将本发明应用于深层网页的集成搜索,可以提高搜索的准确度,从而较大范围地提高人们的工作效率。
-
公开(公告)号:CN101004760A
公开(公告)日:2007-07-25
申请号:CN200710019543.8
申请日:2007-01-10
Applicant: 苏州大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于视觉特征的页面查询接口抽取方法,首先获取一个包含查询接口的页面文档;采用基于视觉的文档分割方法,对上述页面文档构建视觉块树;定位查询接口区域;利用视觉特征识别标签块;再利用视觉特征完成控件块与标签块的分组,由此确定查询接口中的控件及其对应的属性标签,实现查询接口的自动抽取。本发明可以实现查询接口的自动抽取,为进行深层网页的集成搜索提供了基础;实验证明,本发明的基于视觉特征的查询接口自动抽取方法是可行的,并且具有较高的精度;将本发明应用于深层网页的集成搜索,可以提高搜索的准确度,从而较大范围地提高人们的工作效率。
-