基于微博的众包问答系统信息采集方法

    公开(公告)号:CN103106267A

    公开(公告)日:2013-05-15

    申请号:CN201310040557.3

    申请日:2013-02-02

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于微博的众包问答系统信息采集方法,该发明首先实现了与微博平台进行数据交互的数据采集和发布模块,通过该模块自动采集系统相关的所有问答数据和用户资料信息;对于采集到的问答数据进行后台分析处理,为用户提供更直观和专业的回答结果展示;另外,系统通过对用户资料信息和问答行为的具体分析,将各类新问题有效推送给可能回答的潜在用户,以对新问题进行高效、快速扩散;应用本发明的方法,可以通过微博平台实现问答系统更高效快速地获取答案。

    一种基于个体发声能力的音乐推荐方法

    公开(公告)号:CN102880693A

    公开(公告)日:2013-01-16

    申请号:CN201210349723.3

    申请日:2012-09-20

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于个体发声能力的音乐推荐方法,该发明首先设计了一种特定的用户发声引导方法以及歌曲轮廓建立方法,同时提出基于高维声学特征的用户发声音频片段质量评估模型,并建立了个体发声轮廓。在此基础上,通过特征抽取与排序学习,训练得到基于个体发声能力的音乐推荐模型。本发明的方法推荐的歌曲既在测试者能力范围内又不会过于简单,同时通过歌曲剪枝策略加速推荐过程。

    一种在固态硬盘上进行海量数据并行扫描的调度方法

    公开(公告)号:CN101901264B

    公开(公告)日:2012-06-06

    申请号:CN201010237940.4

    申请日:2010-07-27

    Applicant: 浙江大学

    Abstract: 本发明公开了一种在固态硬盘上进行海量数据并行扫描的调度方法。在查询开始时估算其扫描速度,根据速度相近的匹配原则为该扫描选择一个最优的扫描组。在进行扫描时,以扫描组为单位发送正向的公共数据请求,所读取的数据被组内的所有扫描共享。当同组内速度较快的扫描当领先较慢的扫描超过一定距离时,发送反向的补偿数据请求。所有的数据请求被集中处理,其中,正向的公共请求优先级较高,而反向的补偿请求优先级较低。在扫描开始和结束时,计算它对系统总体的影响并调节所有组以达到最优性能。本发明充分发挥了固态硬盘高速随机读的能力,提高了查询的平均响应时间,适合在大规模高并发的数据环境中使用。

    面向近重复图像匹配的SIFT特征裁减方法

    公开(公告)号:CN101697232B

    公开(公告)日:2012-03-07

    申请号:CN200910152880.3

    申请日:2009-09-18

    Applicant: 浙江大学

    Abstract: 本发明公开了一种面向近重复图像匹配的SIFT特征裁减方法。对图像库中每一幅图像进行高斯核卷积处理,得到图像关键点;对关键点对比度和关键点主曲率比分别进行高斯归一化,并进行线性加权得到显著度;按照关键点的显著度从小到大排序,选取用户指定数目的关键点,实现裁减;对裁减后的关键点,根据其位置、尺度和方向信息生成描述子,得到SIFT特征;对所有SIFT特征集合使用局部敏感哈希技术建立图像库索引,提供近重复图像匹配查询功能。利用了图像局部特征技术和局部敏感哈希技术的研究和实现成果,可以方便快捷的提供近重复图像查询能力,使用者根据应用需求调整裁减算法的加权系数和SIFT特征数目上限阈值,以提供最好的性能。

    基于可视程度的Web对象检索方法

    公开(公告)号:CN102156754A

    公开(公告)日:2011-08-17

    申请号:CN201110113865.5

    申请日:2011-05-04

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于可视程度的Web对象检索方法。对具有空间属性的海量Web对象建立IR树索引;用积分式可视性度量方法符合人体视觉感知特征;设计环绕遮挡图结构作为Web对象及IR树节点对象的可视性计算引擎;针对用户可视Web检索需求设计查询匹配度度量函数,融合Web对象相对于用户位置的可视性与相对于查询关键词的语义相关性;利用IR树索引,对提出的环绕遮挡图结构以及查询匹配度度量函数,采用增量式的方法获得K个与用户查询匹配度最高的Web对象。本发明充分利用了IR树索引结构,无缝融合Web对象的空间属性与文本属性,基于积分式可视性度量的环绕遮挡图结构保证了查询的高效性。

    一种利用基于关联规则的遗传算法进行仪表设计的方法

    公开(公告)号:CN101276436B

    公开(公告)日:2011-08-17

    申请号:CN200810061396.5

    申请日:2008-04-25

    Applicant: 浙江大学

    Abstract: 本发明公开了一种利用基于关联规则的遗传算法进行仪表设计的方法。本发明是通过挖掘已有知识库中的元器件关联属性,并在遗传算法中的变异繁殖步骤中利用这些关联采取有针对性的遗传变异,从而提高遗传算法的收敛速度。本发明利用已有的专家知识以及将运算结果加入知识库,不断的扩大知识库的容量,使得在知识库中的仪表设计可行解进行关联规则挖掘的结果更加的可靠。本发明同时在对遗传算法最优解的求取过程中,按照关联规则的置信度进行有选择的变异,能够加快算法的收敛速度,从提高在实际运用中仪表设计系统计算最优仪表方案的速度,解决批量设计仪表方案时的用户长时间等待的问题。

    一种基于树形日志模式分析的博客好友推荐方法

    公开(公告)号:CN102122291A

    公开(公告)日:2011-07-13

    申请号:CN201110020478.7

    申请日:2011-01-18

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于树形日志模式分析的博客好友推荐方法。采用离线挖掘方法,通过对服务器日志的解析,提取出访问者对博客页面的访问记录,通过分组,排序,去回环等技术进一步构造出以待推荐的博客为根的访问日志树,对构造出的访问日志树做频繁挖掘,找出符合预设要求的频繁子树,把频繁子树中的节点作为候选博客好友,按设定的公式进行推荐度计算,取分值最高的若干个进行推荐。算法不同于传统的基于频繁项挖掘或频繁序列挖掘的算法,针对博客圈特有的平行链接关系和间接访问特性,采用了频繁树形结构挖掘的方法,充分发掘,提取了博客间潜在的访问联系,并推荐给访问用户,提高了用户体验,是一种高效,实用的博客推荐方法。

    一种P2P环境中的窗口查询方法

    公开(公告)号:CN101667200B

    公开(公告)日:2011-06-01

    申请号:CN200910152881.8

    申请日:2009-09-18

    Applicant: 浙江大学

    CPC classification number: Y02A10/46

    Abstract: 本发明公开了一种的P2P环境中的窗口查询方法。利用超级节点P2P网络同时具备集中式网络和完全无结构化网络的优点,将窗口查询方法建立在此网络结构上。针对数据的高维特性,在每个单独的网络节点上,数据通过一种降维算法iMinMax映射到一维空间,映射后的值可以通过B+树等传统的DBMS索引结构来存储和查询。然后在每个超级节点上构建数据的统计信息表以及构造网络查询树。节点P发送查询请求时,首先发送到P所属的超级节点上,然后超级节点根据数据的统计信息表在内部完成查询,同时根据网络查询树将查询发送到其他的超级节点,最终完成整个网络的查询,最后返回查询结果到P。该方法能够有效的避免网络泛洪,高效的查询返回数据。

    基于动态裁剪的移动对象反向近邻查询方法

    公开(公告)号:CN102004771A

    公开(公告)日:2011-04-06

    申请号:CN201010545434.1

    申请日:2010-11-12

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于动态裁剪的移动对象反向近邻查询方法。使用TPR-tree对移动对象建立索引;开发移动对象反向近邻查询处理框架,在过滤阶段得到整个时间段内查询点的所有可能的反向近邻候选点集;在精炼阶段去除候选点中的错误点并确定每个反向近邻查询结果点的有效时间;开发两种适用于移动对象反向近邻动态裁剪策略,整合成统一的移动对象反向近邻动态裁剪算法;实现反向近邻动态裁剪算法上实现移动对象反向近邻查询处理过滤算法;对过滤的结果,实现反向近邻查询的精炼算法,对所有查询候选点进行最近邻查询正确性验证和反向近邻有效子时间段计算;对获得的结果点及其有效时间段进行合并,获得在每个子时间段上的反向近邻查询结果集。

    一种自学习的中文地址判重方法

    公开(公告)号:CN101477570A

    公开(公告)日:2009-07-08

    申请号:CN200910095377.9

    申请日:2009-01-12

    Applicant: 浙江大学

    Abstract: 本发明公开了一种自学习的中文地址判重方法。本发明在对中文地址进行判重时,采用自学习的方法。首先处理所有待判重的地址数据,使用规范度计算公式计算出各个地址的规范度,并对符合规范条件的地址提取冗余信息,并计算冗余信息可信度,将可信的冗余信息用于后续的地址数据替换,判重上。本发明方法不依赖领域知识,能够在保证解析精度的前提下,显著降低地址判重中误判和漏判的比例。

Patent Agency Ranking