-
公开(公告)号:CN101907978B
公开(公告)日:2011-12-07
申请号:CN201010237936.8
申请日:2010-07-27
Applicant: 浙江大学
Abstract: 本发明公开了一种基于固态硬盘和磁性硬盘的混合存储系统及存储方法。包括由一块或若干块磁性硬盘组成的阵列、一块或若干块固态硬盘组成的阵列以及一块存储控制器,磁性硬盘阵列和固态硬盘阵列通过存储控制器与计算机总线相连。存储控制器维护从逻辑页面到物理页面的映射表,同时负责对各逻辑页面的访问模式进行统计。依照固态硬盘和磁性硬盘的性能特点,对页面进行优化分布,使数目较少的、随机访问较多的热点页面被分布到固态硬盘阵列中,而大部分的、访问较少或者以顺序访问为主的普通页面分布在磁性硬盘阵列中,从而充分发挥固态硬盘的高速随机访问的性能优势,提高整个系统的访问性能,缩短查询响应时间。
-
公开(公告)号:CN102163230A
公开(公告)日:2011-08-24
申请号:CN201110092557.9
申请日:2011-04-13
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种实现定制隐私保护的个性化信息检索系统的方法。通过分析基于用户模型的个性化信息检索系统的系统架构,利用多粒度语义泛化模型,在现有的个性化信息检索系统基础上提供完备的隐私保护解决方案。本发明定义了用户模型的表现形式、攻击者背景知识和攻击方式以及隐私保护目标,进而提出一个适用于支持隐私保护的个性化信息检索系统的通用框架。本发明在个性化信息检索系统中引入隐私保护的方法,充分利用不同用户对于隐私保护的特殊需求,保证隐私保护结果与用户隐私需求相匹配;而且通过开发查询质量指标和隐私风险指标,分析特定检索特性,权衡检索质量和隐私保护。
-
公开(公告)号:CN101464910B
公开(公告)日:2011-08-17
申请号:CN200910095378.3
申请日:2009-01-12
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于数据相似的聚类压缩方法。本发明通过分析文件数据,从文件提取特征指纹构造特征向量,用于计算数据相似度,并利用带约束条件的图分割方法聚类输入文件集成多个均匀大小的类别,然后采用BMCOM等压缩方法对每个类别单独进行压缩,以去除类内部的冗余数据。本发明利用基于数据采样聚类方式,把具有较高可压缩性的关键数据作为样本数据,首先对样本数据进行聚类,然后通过稳定婚姻方法归类剩余数据,在不降低压缩效果的情况下可提高聚类效率。本发明可以作为一种压缩和归档方法应用到分布式存储系统中,能够克服已有方法的数据依赖和负载不均问题。
-
公开(公告)号:CN101964034A
公开(公告)日:2011-02-02
申请号:CN201010298698.1
申请日:2010-09-30
Applicant: 浙江大学
Abstract: 本发明公开了一种模式信息损失最小化的序列类数据隐私保护方法。基于一个广义的模式定义模型以及实际应用需求来确定模式定义函数集,在此基础上选择能够实现模式信息损失最小化的模式映射函数以提取模式特征。同时基于攻击者的背景知识来确定隐私攻击类型,基于k匿名技术,对时间序列的QI属性值和模式特征施加(k,P)匿名模型,该模型将时间序列的属性泛化区间以及模式特征分别作为独立的形式发布,在保证数据隐私的基础上,将时间序列的模式信息最小化,保证数据的可用性。(k,P)匿名模型能够兼容各种模式定义方式并拥有一套完整的可用性评估机制,其完善性和有效性使得(k,P)匿名模型能够在最大程度上博得信赖,获得广泛应用。
-
公开(公告)号:CN101178720B
公开(公告)日:2010-12-15
申请号:CN200710156189.3
申请日:2007-10-23
Applicant: 浙江大学
Abstract: 本发明公开了一种面向互联网微内容的分布式聚类方法。本发明采用多机分布式聚类的方法,主控机器把要处理的微内容切分成多个小文件,并把这些小文件分配给多台聚类机器进行聚类操作。单台聚类机器对分配到的各个小文件循环进行元聚类,接着合并这些元聚类结果文件,得到相应的单机聚类合并文件,然后把它发送给主控机器。主控机器在接收到各个聚类机器发送过来的单机聚类合并文件后,从各个单机聚类合并文件中抽取微内容代表点,对这些微内容代表点进行再次元聚类,生成新的聚类项,并将对应的类别合并,得到最后的聚类结果。本发明能够准确、快速地对海量级的互联网微内容进行聚类,是一种既高效又实用的分布式聚类方法。
-
公开(公告)号:CN101697232A
公开(公告)日:2010-04-21
申请号:CN200910152880.3
申请日:2009-09-18
Applicant: 浙江大学
Abstract: 本发明公开了一种面向近重复图像匹配的SIFT特征裁减方法。对图像库中每一幅图像进行高斯核卷积处理,得到图像关键点;对关键点对比度和关键点主曲率比分别进行高斯归一化,并进行线性加权得到显著度;按照关键点的显著度从小到大排序,选取用户指定数目的关键点,实现裁减;对裁减后的关键点,根据其位置、尺度和方向信息生成描述子,得到SIFT特征;对所有SIFT特征集合使用局部敏感哈希技术建立图像库索引,提供近重复图像匹配查询功能。利用了图像局部特征技术和局部敏感哈希技术的研究和实现成果,可以方便快捷的提供近重复图像查询能力,使用者根据应用需求调整裁减算法的加权系数和SIFT特征数目上限阈值,以提供最好的性能。
-
公开(公告)号:CN101667200A
公开(公告)日:2010-03-10
申请号:CN200910152881.8
申请日:2009-09-18
Applicant: 浙江大学
CPC classification number: Y02A10/46
Abstract: 本发明公开了一种的P2P环境中的窗口查询方法。利用超级节点P2P网络同时具备集中式网络和完全无结构化网络的优点,将窗口查询方法建立在此网络结构上。针对数据的高维特性,在每个单独的网络节点上,数据通过一种降维算法iMinMax映射到一维空间,映射后的值可以通过B+树等传统的DBMS索引结构来存储和查询。然后在每个超级节点上构建数据的统计信息表以及构造网络查询树。节点P发送查询请求时,首先发送到P所属的超级节点上,然后超级节点根据数据的统计信息表在内部完成查询,同时根据网络查询树将查询发送到其他的超级节点,最终完成整个网络的查询,最后返回查询结果到P。该方法能够有效的避免网络泛洪,高效的查询返回数据。
-
公开(公告)号:CN101667197A
公开(公告)日:2010-03-10
申请号:CN200910152876.7
申请日:2009-09-18
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于滑动窗口的数据流关联规则挖掘方法。利用流数据库管理系统的输入输出机制,将应用产生的原始数据流接入流数据库管理系统。在流数据库管理系统中建立数据流预处理应用环境,并将处理后的输出数据流传递给关联规则挖掘系统。使用关联规则挖掘系统时,用户通过设置滑动窗口大小、步长,关联规则的最小支持度、置信度及其相应的误差值确定关联规则查询条件。关联规则挖掘系统将产生的关联规则实时输出给外部设备。利用数据流上关联规则挖掘的现有研究及实现成果,提出基于滑动窗口的数据流关联规则方法,在已有的流数据库管理系统上,使用者可以根据应用需求选择合适的查询参数,获得最好的性能。
-
公开(公告)号:CN101276436A
公开(公告)日:2008-10-01
申请号:CN200810061396.5
申请日:2008-04-25
Applicant: 浙江大学
IPC: G06N3/12
Abstract: 本发明公开了一种利用基于关联规则的遗传算法进行仪表设计的方法。本发明是通过挖掘已有知识库中的元器件关联属性,并在遗传算法中的变异繁殖步骤中利用这些关联采取有针对性的遗传变异,从而提高遗传算法的收敛速度。本发明利用已有的专家知识以及将运算结果加入知识库,不断的扩大知识库的容量,使得在知识库中的仪表设计可行解进行关联规则挖掘的结果更加的可靠。本发明同时在对遗传算法最优解的求取过程中,按照关联规则的置信度进行有选择的变异,能够加快算法的收敛速度,从提高在实际运用中仪表设计系统计算最优仪表方案的速度,解决批量设计仪表方案时的用户长时间等待的问题。
-
公开(公告)号:CN101272399A
公开(公告)日:2008-09-24
申请号:CN200810061395.0
申请日:2008-04-25
Applicant: 浙江大学
Abstract: 本发明公开了一种基于P2P网络实现全文检索系统的方法。本方法首先将所有普通节点根据各自包含的文档集的内容相似度进行分组,使得内容上相近或相似的普通节点连接同一个超级节点。其次,所有的超级节点组成结构化网络,用于维护“词→相关超级节点列表”的全局查询目录,并且每个超级节点独立维护“词→组内相关普通节点列表”的组内查询目录。本方法利用分层的网络模型和粗粒度的全局查询目录,使得这个P2P全文检索系统能够适应大量节点频繁加入或退出的情况,并且保证查询的性能和减少查询目录的维护代价。
-
-
-
-
-
-
-
-
-