-
公开(公告)号:CN104408101A
公开(公告)日:2015-03-11
申请号:CN201410663862.2
申请日:2014-11-19
Applicant: 南京大学
IPC: G06F17/30
CPC classification number: G06F16/951
Abstract: 本发明涉及一种Web信息抽取集成方法,属于计算机技术领域。该方法包括网页浏览导航、网页数据抽取、数据集成处理步骤,能够应用于各种不同的Web信息采集和挖掘分析应用,具有网页自动浏览导航能力和抽取数据的集成处理能力,因此采用本发明后,可以满足人们从Web中挖掘有价值的数据信息、完成深度价值发现的愿望。
-
公开(公告)号:CN104361093A
公开(公告)日:2015-02-18
申请号:CN201410665797.7
申请日:2014-11-19
Applicant: 南京大学 , 广州科腾信息技术有限公司
IPC: G06F17/30
CPC classification number: G06F17/30873
Abstract: 本发明涉及一种通用的Web自动浏览导航方法,按如下步骤进行:S1、建立Web自动浏览导航的页面交互模型,所述页面交互模型包括导航链接对象和导航链接调用,所述导航链接对象包括导航链接ID、至少一个导航控件描述和一个目标页面描述;所述导航链接调用包括调用导航链接ID和至少一个导航动作描述,所述调用导航链接ID与导航链接对象中的导航链接ID对应;S2、根据页面交互模型录制用户在Web页面的动作,采集与页面交互模型中匹配的信息形成页面交互规则;S3、自动回放并执行页面交互规则,模拟用户与Web页面的交互操作。本发明完成网页的自动化访问和获取,灵活性强、定位准确且复杂度低、通用性好。
-