-
公开(公告)号:CN102103636B
公开(公告)日:2013-08-07
申请号:CN201110020898.5
申请日:2011-01-18
Applicant: 南京信息工程大学
IPC: G06F17/30
Abstract: 本发明公布了一种面向深层网页的增量信息获取方法。本发明方法包括:步骤1:确定与远程数据源同步频率;步骤2:利用泊松过程来表示数据源变化频率;步骤3:确定平均新颖度;步骤4:根据数据时新性确定更新频率进行增量信息获取。另外,本发明还可以利用在线学习方法有效进行增量信息获取。本发明方法首先确定与远程数据源同步频率,然后利用泊松过程获得数据源变化频率;接着根据数据时新性确定更新频率。相比现有技术,本发明方法是一种非常高效的深层网页的增量信息获取方法,它能够较大范围地提高人们的工作效率以及在相同更新资源条件下,使得本地数据和远程数据保持最大化同步,为进一步实现深层网数据源集成提供基础。
-
公开(公告)号:CN102103636A
公开(公告)日:2011-06-22
申请号:CN201110020898.5
申请日:2011-01-18
Applicant: 南京信息工程大学
IPC: G06F17/30
Abstract: 本发明公布了一种面向深层网页的增量信息获取方法。本发明方法包括:步骤1:确定与远程数据源同步频率;步骤2:利用泊松过程来表示数据源变化频率;步骤3:确定平均新颖度;步骤4:根据数据时新性确定更新频率进行增量信息获取。另外,本发明还可以利用在线学习方法有效进行增量信息获取。本发明方法首先确定与远程数据源同步频率,然后利用泊松过程获得数据源变化频率;接着根据数据时新性确定更新频率。相比现有技术,本发明方法是一种非常高效的深层网页的增量信息获取方法,它能够较大范围地提高人们的工作效率以及在相同更新资源条件下,使得本地数据和远程数据保持最大化同步,为进一步实现深层网数据源集成提供基础。
-