-
公开(公告)号:CN103455564B
公开(公告)日:2018-11-13
申请号:CN201310356319.3
申请日:2013-08-15
Applicant: 复旦大学
IPC: G06F17/30
Abstract: 本发明属于关系数据库技术领域,具体为一种根据维基百科中话题信息使查询词项多样化的方法。该方法的步骤为:给定目标查询词t0,候选扩展集T,维基百科中的话题信息C和页面信息D(C),相似性函数sim1、sim2,整数k和实数(),通过贪心方法,在每一轮迭代中寻找当前与目标查询词t0既相似又同时具有最大的话题多样性的词项,直至k个词项都被找到。本发明在扩展查询此项时引入了外部的维基百科分类信息,从而使扩展的多样性得以更高。
-
公开(公告)号:CN103455564A
公开(公告)日:2013-12-18
申请号:CN201310356319.3
申请日:2013-08-15
Applicant: 复旦大学
IPC: G06F17/30
Abstract: 本发明属于关系数据库技术领域,具体为一种根据维基百科中话题信息使查询词项多样化的方法。该方法的步骤为:给定目标查询词t0,候选扩展集T,维基百科中的话题信息C和页面信息D(C),相似性函数sim1、sim2,整数k和实数(),通过贪心方法,在每一轮迭代中寻找当前与目标查询词t0既相似又同时具有最大的话题多样性的词项,直至k个词项都被找到。本发明在扩展查询此项时引入了外部的维基百科分类信息,从而使扩展的多样性得以更高。
-