-
公开(公告)号:CN101419630A
公开(公告)日:2009-04-29
申请号:CN200810239188.X
申请日:2008-12-11
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明涉及一种数据流中Top-k项的挖掘方法和系统,方法包括:步骤1,初始化平衡二叉树,所述平衡二叉树的节点用于存储数据流中数据项的信息,所述信息包括所述数据项对应的时间戳和计数器的值;步骤2,将数据流中的数据项的信息存储到所述平衡二叉树节点中,所述节点在平衡二叉树中的位置依据排序规则,所述排序规则以所述数据项对应的时间戳和计数器的值为参数;步骤3,按用户需求遍历所述平衡二叉树,输出Top-k项的统计结果。本发明能够降低了最差处理时间,降低了存储空间,提高了挖掘的准确性。
-
公开(公告)号:CN101295276A
公开(公告)日:2008-10-29
申请号:CN200810115329.7
申请日:2008-06-20
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种磁盘级数据备份系统和其运行方法,该系统包括备份控制装置、写前读装置、备份读装置、磁盘过滤驱动装置、换页装置、备份快照表、内存缓存队列和硬盘缓存文件。系统首选获取用于记录磁盘扇区数据是否需要备份的备份快照表;根据获取的备份快照表从磁盘上依次读取需要备份的磁盘扇区数据进行备份,同时开始监控磁盘操作;监控并截获写磁盘操作;如果在备份期间截获到写操作信号,从被写磁盘读取并存储数据至内存缓存队列,当内存缓存队列的数据超过预定长度时,将数据移出到硬盘缓存文件,发送写操作放行信号,完成写前读操作。本发明能够在上层业务不中断的情况下保证备份数据时间一致,避免死锁;且具有较高业务应用无关性。
-