-
公开(公告)号:CN101320386A
公开(公告)日:2008-12-10
申请号:CN200810116467.7
申请日:2008-07-10
Applicant: 北京大学
Abstract: 本发明公开了一种车辆自组织网络中多目标查询的方法,包括:S1,查询发起车辆、若干中间车辆、若干目标查询车辆组成车辆自组织网络;S2,查询发起车辆确定多个不同的查询目标信息和第一查询路径组;S3,查询发起车辆根据第一查询路径组将查询目标信息发送给各个中间车辆;S4,各个中间车辆根据第一查询路径组将各自接收的查询目标信息发送给各个目标查询车辆;S5,各个目标查询车辆根据各自接收的查询目标信息获取查询结果,并将查询结果根据第一查询路径组反馈给查询发起车辆。本发明基于道路网络,能够减少消息的传输数量,减少查询计划构建本身的代价,提高查询的稳定性,使用户可以同时查询多个目标,节约用户的时间。
-
公开(公告)号:CN103514183B
公开(公告)日:2017-04-12
申请号:CN201210209911.6
申请日:2012-06-19
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明提供一种基于交互式文档聚类的信息检索方法和系统,其步骤包括:对文档集进行水平划分和预处理;进行词频统计,并将高频词组成特证词集合;生成文档的向量空间表示,计算文档间的距离并生成相似度矩阵;生成拉普拉斯矩阵,根据拉普拉斯矩阵的特征值间隔确定聚类数及表示矩阵,并进行二次聚类,得到初始距离结果;用户对初始聚类结果进行交互操作,使用卡方统计量挖掘新的特证词并重构向量空间,然后重复进行上述聚类过程;最后将聚类结果展示给用户,供用户获得不同类别的检索结果。本发明采用有用户介入的半监督学习方式,对文档进行聚类分析,供用户获得不同类别的检索结果。
-
公开(公告)号:CN103488639A
公开(公告)日:2014-01-01
申请号:CN201210192018.7
申请日:2012-06-11
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明提供一种XML数据的查询方法,其步骤包括:1)采用Native XML方式存储XML数据,其存储结构包括:内节点层,存储XML树的节点,XML元素采用DDE编码方式进行编码;叶节点层,存储XML树叶节点的文本数据;倒排层,存储内节点层的倒排索引;2)根据输入的XPath查询语句,从所述倒排层中取出与所述XPath的节点对应的元素序列,并采用败者树进行归并排序;3)对归并排序后的XML元素按顺序进行入栈和出栈操作,从缓冲区得到查询结果。本发明能够处理带有关键字“OR”和通配符“*”的XPath,并具有很高的效率。
-
公开(公告)号:CN103150404A
公开(公告)日:2013-06-12
申请号:CN201310104904.4
申请日:2013-03-28
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明公开了一种关系-XML混合数据关键字查询方法。本发明为:1)根据数据库的模式信息从数据库中读取数据,生成元组数据图;数据库为对关系数据和XML数据是逻辑上共同存储,物理上分开存储;2)对关系数据与XML数据进行倒排索引;3)查找输入关键字出现的对应位置;若在某个元组中,则标记该元组为候选节点,然后在元组数据图中查找包含该候选节点的最小生成树;若在某个XML文档中,则将该文档所在元组标记为候选节点,然后在元组数据图中查找包含该候选节点的最小生成树,再在该XML文档中查找包含关键字的最小公共祖先节点;4)返回包含查询关键字结构信息的关系-XML数据查询结果。本发明实现了混合数据的关键字查询。
-
公开(公告)号:CN102096706B
公开(公告)日:2013-03-06
申请号:CN201110001240.X
申请日:2011-01-05
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明公开了一种变步长XML编码方法,属于数据库存储领域。本方法为:1)设定XML文档编码的步长值为PACE;2)对于新插入的XML节点r:如果r作为某非叶节点j的第一个子节点插入时,则将j中原第一个子节点编码最后一位减去PACE作为r的编码;如果r作为j的最后一子节点插入时,则将j中原最后一子节点编码最后一位加上PACE作为r的编码;r在两兄弟节点之间插入时,如果两兄弟节点编码第一位相等且最后一位PACE内的整数没有用完,则r编码最后一位为PACE内一整数,否则采用DDE方法对r进行编码;如果r作为某叶节点k的子节点插入,则将k编码后面增加一成分1作为r的编码。本方法大大提高了编码效率。
-
公开(公告)号:CN102799622A
公开(公告)日:2012-11-28
申请号:CN201210209080.2
申请日:2012-06-19
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明涉及基于MapReduce扩展框架的分布式SQL查询方法,1)客户端发送查询请求到查询服务器模块QueryServer,所述查询服务器模块包括:SQL查询接口、SLQ解析模块和动态选择模块;2)所述SQL查询接口接收到查询请求,将所述请求发送到SQL解析模块,所述解析模块解析得到查询请求的语义;3)所述动态选择模块根据查询代价模型Cost Model和语义规则对该查询语义进行计算,预测出查询结果需要的存储空间,并选择MapReduce查询方式或内存查询方式;4)当查询结束,将本地查询结果上传至HDFS或数据处理服务器模块Data Processor。本发明基于内存的拓展框架,利用内存处理的方式处理SQL查询,在内存中完成数据处理,提高查询的效率。同时查询服务器模块实现与客户端的交互和查询处理方式的动态选择。
-
公开(公告)号:CN102737114A
公开(公告)日:2012-10-17
申请号:CN201210157463.X
申请日:2012-05-18
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于MapReduce的大图上距离连接查询方法,其步骤包括:1)提取初始化的查询参数:原图、已访问结点、拓展范围和查询结果;2)在hadoop上对原图进行双向拓展,拓展从源结点集合和目标结点集合开始,每次拓展基于代价模型,采用动态阈值剪枝操作,将新拓展的结点加入已访问结点集合;3)继续遍历未完成拓展的剩余结点,直到所有满足拓展范围的结点都完成拓展;4)完成迭代后,记录所述已访问节点集合中目标结点和源结点间路径查询结果,返回查询结果。本发明在MapReduce环境下提出了一种基于代价模型的自适应方法,基于动态阈值进行剪枝的双向搜索算法和Segment索引减少拓展空间和迭代次数,提高任务的执行效率。
-
公开(公告)号:CN102043848B
公开(公告)日:2012-07-18
申请号:CN201010596864.6
申请日:2010-12-20
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明公开了一种XML文档树实例查询方法,属于模糊查询领域。本方法为:1)将数据库中的XML文档和待查询XML文档分别转化为文档树;2)根据待查询XML文档树在XML文档树数据库中选取节点数在设定范围内的XML文档树,得到一待计算数据集;3)计算待查询XML文档树与待计算数据集中每一XML文档树之间的相似度,得到一候选查询结果集;4)计算待查询XML文档树与候选查询结果集中XML文档树的编辑距离;5)根据4)计算的编辑距离对候选查询结果集中XML文档树进行排序,得到查询结果。与现有技术相比,本方法大大提高了查询效率,同时在一定程度上容忍目标数据与输入的错误。
-
公开(公告)号:CN102073716A
公开(公告)日:2011-05-25
申请号:CN201110001234.4
申请日:2011-01-05
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明公开了一种数据外包环境下的查询结果验证方法,属于数据库管理系统领域。本方法为:1)数据源端构造存储到外包服务器端的数据集D的Hash表;2)客户端将查询请求分别发送到数据源端和外包服务器端;3)数据源端查询该Hash表中满足查询请求的XML文档树结构根节点的散列值HD,并通过安全通道将其发送给客户端;4)外包服务器端根据查询请求返回查询处理结果R’给客户端,并提供可计算出该HD的验证数据S;5)客户端根据散列函数、返回数据R’以及验证数据S计算出HD’,并检验HD’=HD是否成立;若成立则返回结果正确,否则错误。本发明可保证查询结果的完全性和正确性,为查询结果在实际应用中的重要性提供保障。
-
公开(公告)号:CN101625692A
公开(公告)日:2010-01-13
申请号:CN200910090288.5
申请日:2009-08-04
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明涉及一种动态脚本网站数据快速收集方法,其特征在于:它包括以下步骤:i)获取Index页面并保存,将Index页面加入待处理队列;ii)判断待处理队列是否为空,若为空则表明抓取完成,退出抓取过程;否则从待处理队列中任意选择一个页面,利用页面相似性得到当前页面的类型,根据训练步骤中提取出的XPath路径特征,确定类型需要触发哪些页面元素上的哪些事件;iii)判断当前页面是否有未触发过的事件,若没有则跳转到步骤ii);否则触发事件,判断当前页面是否变化且变化后的页面为新页面,若没有变化或非新页面则跳转到步骤v);否则继续执行步骤iv);vi)保存新页面并将新页面加入到步骤i)中的待处理队列;v)回退到触发事件前的页面状态,并跳转到步骤iii)。
-
-
-
-
-
-
-
-
-