-
公开(公告)号:CN107291895A
公开(公告)日:2017-10-24
申请号:CN201710476244.0
申请日:2017-06-21
Applicant: 浙江大学
Abstract: 本发明公开了一种快速的层次化文档查询方法。对文档集中的每个文档建立数据模型,对文档进行格式化处理获得文档质心向量和文档标签;生成的文档质心向量作为高维向量空间中的一个点,为每个文档集采用局部敏感哈希方法在内存中构建哈希索引结构;依据查询文本的文档质心向量,采用基于局部敏感哈希思想的查询方法在哈希索引结构中获取一个候选文档集;依据查询文本的文档标签,采用过滤-细化的层次化框架在候选文档集中获取词移动距离度量下的最近邻文档。本发明设计的层次化查询方法应用于文档分类和检索时在效率和效果上获得了良好的平衡,使得用户在进行词移动距离度量下的文档查询时能够在保证准确性的情况下快速地获取目标文档。
-
公开(公告)号:CN104572915B
公开(公告)日:2017-10-10
申请号:CN201410833448.1
申请日:2014-12-29
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于内容环境增强的用户事件相关度计算方法。利用话题模型将用户和社交事件的档案降低维度转化成话题分布;计算得到该用户档案和该社交事件档案的用户偏好特征;将用户偏好特征作为用户参加所对应事件的概率,计算采用基于协同过滤方法提取线上、线下社交影响特征;根据用户城市的事件,得到当地兴趣的话题分布,再与事件比较来得到本地流行度特征;通过训练学习排序模型,得到用户事件相关度。本发明通过充分挖掘事件社交网络中的内容环境相关信息,提取出用户偏好、社交影响、当地流行度的特征进行计算,并通过结合多项特征提高了最终结果的准确度,解决了个性化推荐系统中针对社交事件这类新对象进行推荐的技术问题。
-
公开(公告)号:CN102890713B
公开(公告)日:2015-08-12
申请号:CN201210349719.7
申请日:2012-09-20
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于用户当前地理位置和物理环境的音乐推荐方法,本发明一种合理的音乐推荐架构,并设计了一种用户当前位置和物理环境特征的表达结构,这种结构支持高效的向量匹配算法;同时,针对海量照片对象的空间属性与文本属性,本发明采用了支持高效插入、删除、更新操作的变种空间索引结构;以此索引结构为基础,结合音乐歌词的语义性和照片具有的空间性和语义性,可供用户根据自己的当前位置和物理环境获取最佳的推荐音乐。
-
公开(公告)号:CN102163230B
公开(公告)日:2013-01-09
申请号:CN201110092557.9
申请日:2011-04-13
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种实现定制隐私保护的个性化信息检索系统的方法。通过分析基于用户模型的个性化信息检索系统的系统架构,利用多粒度语义泛化模型,在现有的个性化信息检索系统基础上提供完备的隐私保护解决方案。本发明定义了用户模型的表现形式、攻击者背景知识和攻击方式以及隐私保护目标,进而提出一个适用于支持隐私保护的个性化信息检索系统的通用框架。本发明在个性化信息检索系统中引入隐私保护的方法,充分利用不同用户对于隐私保护的特殊需求,保证隐私保护结果与用户隐私需求相匹配;而且通过开发查询质量指标和隐私风险指标,分析特定检索特性,权衡检索质量和隐私保护。
-
公开(公告)号:CN102012908B
公开(公告)日:2012-11-21
申请号:CN201010545431.8
申请日:2010-11-12
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种障碍物环境中可视移动近邻的查询方法。利用空间数据库中移动对象的近邻查询技术,在存在障碍物的环境中,将现有分支定界方法运用到未被遮挡的近邻的查询之中。在空间数据中,对障碍物运用R树索引,对于移动对象,采用TPR树索引,利用分支定界法遍历索引,同时结合移动对象的遮挡时间计算来实现查询。利用了空间数据库中现有索引技术、移动对象近邻查询技术以及在有障碍环境下的研究和实现成果,提供了在障碍环境中查询某段时间内未被阻挡的移动对象,使用者可根据应用需求选择最合适的查询时段,提供最好的性能。
-
公开(公告)号:CN102156754B
公开(公告)日:2012-10-03
申请号:CN201110113865.5
申请日:2011-05-04
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于可视程度的Web对象检索方法。对具有空间属性的海量Web对象建立IR树索引;用积分式可视性度量方法符合人体视觉感知特征;设计环绕遮挡图结构作为Web对象及IR树节点对象的可视性计算引擎;针对用户可视Web检索需求设计查询匹配度度量函数,融合Web对象相对于用户位置的可视性与相对于查询关键词的语义相关性;利用IR树索引,对提出的环绕遮挡图结构以及查询匹配度度量函数,采用增量式的方法获得K个与用户查询匹配度最高的Web对象。本发明充分利用了IR树索引结构,无缝融合Web对象的空间属性与文本属性,基于积分式可视性度量的环绕遮挡图结构保证了查询的高效性。
-
公开(公告)号:CN101908065B
公开(公告)日:2012-05-23
申请号:CN201010237922.6
申请日:2010-07-27
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种支持动态更新的在线属性异常点检测方法。通过分析实际应用及用户需求,提出全新的属性异常点定义,在考虑数据集内部各个数据点间属性相关性的前提下检测异常点,提供相对于传统定义更加有效的异常信息,结合实际流数据系统应用,通过使用滑动窗口、在线聚类方法达到支持对动态更新的流数据进行在线属性异常点检测,能够为用户提供实时检测结果反馈。并且针对流数据系统应用中实际出现的系统过载情况,提出一套有效的降载方法,能够保证检测方法在海量的流数据更新情况下仍能实时反馈检测结果,且结果误差在用户可控范围,达到检测方法在运行效率和结果精度之间的有效平衡。
-
公开(公告)号:CN102193996A
公开(公告)日:2011-09-21
申请号:CN201110113856.6
申请日:2011-05-04
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于移动设备的可视Web对象搜索引擎方法。该方法的步骤如下:利用爬虫对Web对象进行抓取,针对Web对象的空间属性与语义属性设计数据模型并建立Web对象数据库,并在此基础上建立IR树索引。在处理用户的可视Web对象检索请求时,加入物理因素(如位置、朝向、视角等)的影响,融合Web对象的可视信息与语义信息,以一种“所见即所得”的方式返回搜索结果。本发明并能够随着用户位置或朝向的变化动态更新搜索结果,让用户产生身临其境的体验,从而将物理世界与数字信息世界紧密地结合起来。
-
公开(公告)号:CN101158958B
公开(公告)日:2010-06-09
申请号:CN200710156183.6
申请日:2007-10-23
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于MySQL存储引擎的融合查询方法。利用MySQL数据库的存储引擎插件机制,开发全文检索存储引擎,将现有全文检索系统链接到MySQL数据库中。在MySQL数据库中使用“全文检索链接表”来表示全文检索系统,用户通过标准的SQL访问“全文检索链接表”时,全文检索存储引擎自动将全文检索请求转发至全文检索系统处理。通过“全文检索链接表”与其它表示结构化信息的数据库之间的联接等SQL操作实现融合查询。利用了数据库和全文检索和现有研究和实现成果,基于已有系统可以方便快捷的提供融合查询能力,并且不依赖于一种特有的全文检索系统实现,使用者根据应用需求选择最合适的全文检索系统,提供最好的性能。
-
公开(公告)号:CN101706790A
公开(公告)日:2010-05-12
申请号:CN200910152879.0
申请日:2009-09-18
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种搜索引擎中包含WEB对象的聚类方法。通过挖掘词汇间的树状概率层次关系,计算词汇在数据集中的信息分布集中度,作为分辨对象的标志。该方法建立一个新型的信息传递有向无环图模型,准确提取数据中对辨别对象起到关键作用的特征词汇,提高相似度计算的精确性,并且建立一种新型的自适应记录合并模型,有效地提高各个记录簇中记录间高相似度比例,减少噪音对合并过程的影响,具有很高的准确性,健壮性和通用性。本发明充分利用了垂直搜索引擎环境中检索系统的现有研究和实现成果,可以方便快捷的提高WEB对象的聚类结果细粒度,并且不依赖于一种特有的文本检索技术,使用者根据应用需求选择最合适的聚类合并技术,提供最好的性能。
-
-
-
-
-
-
-
-
-