-
公开(公告)号:CN101464910B
公开(公告)日:2011-08-17
申请号:CN200910095378.3
申请日:2009-01-12
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于数据相似的聚类压缩方法。本发明通过分析文件数据,从文件提取特征指纹构造特征向量,用于计算数据相似度,并利用带约束条件的图分割方法聚类输入文件集成多个均匀大小的类别,然后采用BMCOM等压缩方法对每个类别单独进行压缩,以去除类内部的冗余数据。本发明利用基于数据采样聚类方式,把具有较高可压缩性的关键数据作为样本数据,首先对样本数据进行聚类,然后通过稳定婚姻方法归类剩余数据,在不降低压缩效果的情况下可提高聚类效率。本发明可以作为一种压缩和归档方法应用到分布式存储系统中,能够克服已有方法的数据依赖和负载不均问题。
-
公开(公告)号:CN101964034A
公开(公告)日:2011-02-02
申请号:CN201010298698.1
申请日:2010-09-30
Applicant: 浙江大学
Abstract: 本发明公开了一种模式信息损失最小化的序列类数据隐私保护方法。基于一个广义的模式定义模型以及实际应用需求来确定模式定义函数集,在此基础上选择能够实现模式信息损失最小化的模式映射函数以提取模式特征。同时基于攻击者的背景知识来确定隐私攻击类型,基于k匿名技术,对时间序列的QI属性值和模式特征施加(k,P)匿名模型,该模型将时间序列的属性泛化区间以及模式特征分别作为独立的形式发布,在保证数据隐私的基础上,将时间序列的模式信息最小化,保证数据的可用性。(k,P)匿名模型能够兼容各种模式定义方式并拥有一套完整的可用性评估机制,其完善性和有效性使得(k,P)匿名模型能够在最大程度上博得信赖,获得广泛应用。
-
公开(公告)号:CN101178720B
公开(公告)日:2010-12-15
申请号:CN200710156189.3
申请日:2007-10-23
Applicant: 浙江大学
Abstract: 本发明公开了一种面向互联网微内容的分布式聚类方法。本发明采用多机分布式聚类的方法,主控机器把要处理的微内容切分成多个小文件,并把这些小文件分配给多台聚类机器进行聚类操作。单台聚类机器对分配到的各个小文件循环进行元聚类,接着合并这些元聚类结果文件,得到相应的单机聚类合并文件,然后把它发送给主控机器。主控机器在接收到各个聚类机器发送过来的单机聚类合并文件后,从各个单机聚类合并文件中抽取微内容代表点,对这些微内容代表点进行再次元聚类,生成新的聚类项,并将对应的类别合并,得到最后的聚类结果。本发明能够准确、快速地对海量级的互联网微内容进行聚类,是一种既高效又实用的分布式聚类方法。
-
公开(公告)号:CN101697232A
公开(公告)日:2010-04-21
申请号:CN200910152880.3
申请日:2009-09-18
Applicant: 浙江大学
Abstract: 本发明公开了一种面向近重复图像匹配的SIFT特征裁减方法。对图像库中每一幅图像进行高斯核卷积处理,得到图像关键点;对关键点对比度和关键点主曲率比分别进行高斯归一化,并进行线性加权得到显著度;按照关键点的显著度从小到大排序,选取用户指定数目的关键点,实现裁减;对裁减后的关键点,根据其位置、尺度和方向信息生成描述子,得到SIFT特征;对所有SIFT特征集合使用局部敏感哈希技术建立图像库索引,提供近重复图像匹配查询功能。利用了图像局部特征技术和局部敏感哈希技术的研究和实现成果,可以方便快捷的提供近重复图像查询能力,使用者根据应用需求调整裁减算法的加权系数和SIFT特征数目上限阈值,以提供最好的性能。
-
公开(公告)号:CN101667200A
公开(公告)日:2010-03-10
申请号:CN200910152881.8
申请日:2009-09-18
Applicant: 浙江大学
CPC classification number: Y02A10/46
Abstract: 本发明公开了一种的P2P环境中的窗口查询方法。利用超级节点P2P网络同时具备集中式网络和完全无结构化网络的优点,将窗口查询方法建立在此网络结构上。针对数据的高维特性,在每个单独的网络节点上,数据通过一种降维算法iMinMax映射到一维空间,映射后的值可以通过B+树等传统的DBMS索引结构来存储和查询。然后在每个超级节点上构建数据的统计信息表以及构造网络查询树。节点P发送查询请求时,首先发送到P所属的超级节点上,然后超级节点根据数据的统计信息表在内部完成查询,同时根据网络查询树将查询发送到其他的超级节点,最终完成整个网络的查询,最后返回查询结果到P。该方法能够有效的避免网络泛洪,高效的查询返回数据。
-
公开(公告)号:CN101667197A
公开(公告)日:2010-03-10
申请号:CN200910152876.7
申请日:2009-09-18
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于滑动窗口的数据流关联规则挖掘方法。利用流数据库管理系统的输入输出机制,将应用产生的原始数据流接入流数据库管理系统。在流数据库管理系统中建立数据流预处理应用环境,并将处理后的输出数据流传递给关联规则挖掘系统。使用关联规则挖掘系统时,用户通过设置滑动窗口大小、步长,关联规则的最小支持度、置信度及其相应的误差值确定关联规则查询条件。关联规则挖掘系统将产生的关联规则实时输出给外部设备。利用数据流上关联规则挖掘的现有研究及实现成果,提出基于滑动窗口的数据流关联规则方法,在已有的流数据库管理系统上,使用者可以根据应用需求选择合适的查询参数,获得最好的性能。
-
公开(公告)号:CN101276436A
公开(公告)日:2008-10-01
申请号:CN200810061396.5
申请日:2008-04-25
Applicant: 浙江大学
IPC: G06N3/12
Abstract: 本发明公开了一种利用基于关联规则的遗传算法进行仪表设计的方法。本发明是通过挖掘已有知识库中的元器件关联属性,并在遗传算法中的变异繁殖步骤中利用这些关联采取有针对性的遗传变异,从而提高遗传算法的收敛速度。本发明利用已有的专家知识以及将运算结果加入知识库,不断的扩大知识库的容量,使得在知识库中的仪表设计可行解进行关联规则挖掘的结果更加的可靠。本发明同时在对遗传算法最优解的求取过程中,按照关联规则的置信度进行有选择的变异,能够加快算法的收敛速度,从提高在实际运用中仪表设计系统计算最优仪表方案的速度,解决批量设计仪表方案时的用户长时间等待的问题。
-
公开(公告)号:CN101272399A
公开(公告)日:2008-09-24
申请号:CN200810061395.0
申请日:2008-04-25
Applicant: 浙江大学
Abstract: 本发明公开了一种基于P2P网络实现全文检索系统的方法。本方法首先将所有普通节点根据各自包含的文档集的内容相似度进行分组,使得内容上相近或相似的普通节点连接同一个超级节点。其次,所有的超级节点组成结构化网络,用于维护“词→相关超级节点列表”的全局查询目录,并且每个超级节点独立维护“词→组内相关普通节点列表”的组内查询目录。本方法利用分层的网络模型和粗粒度的全局查询目录,使得这个P2P全文检索系统能够适应大量节点频繁加入或退出的情况,并且保证查询的性能和减少查询目录的维护代价。
-
公开(公告)号:CN101158958A
公开(公告)日:2008-04-09
申请号:CN200710156183.6
申请日:2007-10-23
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于MySQL存储引擎的融合查询方法。利用MySQL数据库的存储引擎插件机制,开发全文检索存储引擎,将现有全文检索系统链接到MySQL数据库中。在MySQL数据库中使用“全文检索链接表”来表示全文检索系统,用户通过标准的SQL访问“全文检索链接表”时,全文检索存储引擎自动将全文检索请求转发至全文检索系统处理。通过“全文检索链接表”与其它表示结构化信息的数据库之间的联接等SQL操作实现融合查询。利用了数据库和全文检索和现有研究和实现成果,基于已有系统可以方便快捷的提供融合查询能力,并且不依赖于一种特有的全文检索系统实现,使用者根据应用需求选择最合适的全文检索系统,提供最好的性能。
-
公开(公告)号:CN1174543C
公开(公告)日:2004-11-03
申请号:CN02112194.X
申请日:2002-06-21
Applicant: 浙江大学
IPC: H02M3/28
CPC classification number: Y02B70/1491
Abstract: 本发明的相移控制双向直流-直流变换器,具有主电路和控制电路两部分,主电路包括四个开关管M1~M4、钳位电容Cc1、两个隔直电容Ct1、Ct2、滤波电感Lo和隔离变压器T,控制电路包括相移控制芯片,接于相移控制芯片输出端的两个PWM控制芯片,每个控制芯片的误差放大器正端接占空比控制信号,输出端分二路,分别与两个数据选择器的输入端相连,数据选择器的输出信号分二路,其一路输入主电路驱动器,另一路经非门输入主电路驱动器,由驱动电路输出的驱动信号控制主电路开关管。本发明在相移控制传输功率大小和方向的基础上,根据两侧电压幅值,跟踪调节PWM的占空比,能有效的减小变换器的电流应力和电流有效值,并且变换器可以实现软开关工作,提高效率。
-
-
-
-
-
-
-
-
-