一种自下而上的XML分支模式匹配方法

    公开(公告)号:CN102760173B

    公开(公告)日:2015-04-08

    申请号:CN201210229103.6

    申请日:2012-07-02

    Applicant: 河海大学

    Abstract: 本发明公开了一种自下而上的XML分支模式(Twig Pattern)匹配方法,采用自下而上的匹配顺序。首先解析分支模式,解析结果保存在Nodes,Depths,Relations,BranchingNodes,Pointers五个数组里。在获取节点层次信息的基础上,采用FilterStream节点筛选机制来筛选不符合层次要求的元素。然后进行分支模式匹配;通过判断节点的父亲或祖先节点的编码是否存在来确定节点间的结构关系,将节点间结构关系的判断转换为字符串查找问题,从而将元素间一对一的结构关系判断转换为元素间一对多的判断;达到利用现有的字符串查找技术来解决分支模式匹配问题。

    一种面向任意段数据的Top-k查询方法

    公开(公告)号:CN102799681B

    公开(公告)日:2014-11-12

    申请号:CN201210257640.1

    申请日:2012-07-24

    Applicant: 河海大学

    Abstract: 本发明公开一种面向任意段数据的Top-k查询方法,首先进行采集数据;然后分析数据特点,根据数据特点建立索引结构:若数据量较小,DG索引已经建好,则进入基于DG索引的任意段数据Top-k查询;若数据量较大,DG索引上的结点较为稀疏时,则进入基于双层支配图DDG索引结构的Top-k查询;若当任意段确定比较困难时,则进入基于DG和GS的混合索引查询。该方法具有能够适合全局Top-k查询和任意段数据的部分Top-k查询的索引,提高Top-k查询应用的自由性和任意性。

    一种面向任意段数据的Top-k查询方法

    公开(公告)号:CN102799681A

    公开(公告)日:2012-11-28

    申请号:CN201210257640.1

    申请日:2012-07-24

    Applicant: 河海大学

    Abstract: 本发明公开一种面向任意段数据的Top-k查询方法,首先进行采集数据;然后分析数据特点,根据数据特点建立索引结构:若数据量较小,DG索引已经建好,则进入基于DG索引的任意段数据Top-k查询;若数据量较大,DG索引上的结点较为稀疏时,则进入基于双层支配图DDG索引结构的Top-k查询;若当任意段确定比较困难时,则进入基于DG和GS的混合索引查询。该方法具有能够适合全局Top-k查询和任意段数据的部分Top-k查询的索引,提高Top-k查询应用的自由性和任意性。

    一种自下而上的XML分支模式匹配方法

    公开(公告)号:CN102760173A

    公开(公告)日:2012-10-31

    申请号:CN201210229103.6

    申请日:2012-07-02

    Applicant: 河海大学

    Abstract: 本发明公开了一种自下而上的XML分支模式(TwigPattern)匹配方法,采用自下而上的匹配顺序。首先解析分支模式,解析结果保存在Nodes,Depths,Relations,BranchingNodes,Pointers五个数组里。在获取节点层次信息的基础上,采用FilterStream节点筛选机制来筛选不符合层次要求的元素。然后进行分支模式匹配;通过判断节点的父亲或祖先节点的编码是否存在来确定节点间的结构关系,将节点间结构关系的判断转换为字符串查找问题,从而将元素间一对一的结构关系判断转换为元素间一对多的判断;达到利用现有的字符串查找技术来解决分支模式匹配问题。

    一种面向海量数据的数据交换方法

    公开(公告)号:CN102420864B

    公开(公告)日:2014-03-26

    申请号:CN201110391794.5

    申请日:2011-12-01

    Applicant: 河海大学

    Abstract: 本发明公开了一种面向海量数据的数据交换方法,属于信息技术处理领域。包括以下步骤:数据更新控制模块接收新数据,并对数据进行BT编码形成种子文件;分发策略管理模块查找是否有用户订阅该数据,如果有则通知订阅者下载种子文件,订阅者解析种子文件得到Tracker服务器地址,连接Tracker服务器,得到所有上传或下载该数据的Peer信息并把自己的信息上传到Tracker服务器,所有Peer之间进行P2P数据交换;如果没有订阅者,则结束,不进行数据交换。本发明解决了海量数据传输交换过程中存在的传输速度慢、服务器负载重、信息更新发送不及时等问题。

    基于XMLSchema的软件界面生成系统及方法

    公开(公告)号:CN102646039A

    公开(公告)日:2012-08-22

    申请号:CN201210049014.3

    申请日:2012-02-29

    Applicant: 河海大学

    Abstract: 本发明公开了基于XMLSchema的软件界面生成系统及方法,属于信息处理的技术领域。所述软件界面生成系统包括依次连接XMLSchema管理模块、XMLSchema解析模块、软件界面生成模块、数据验证及更新模块。所述软件界面生成方法通过XMLSchema管理模块提供的管理界面选择用于生成软件界面的XMLSchema文件;XMLSchema解析模块获取DOM树结构;软件界面生成模块将的DOM树转化为HTMLDOM树结构形成最终的软件界面;数据验证及更新模块用XMLSchema文件验证用户上传的数据。本发明解决了软件界面设计周期长、复用率低、界面代码修改成本过高等问题。

    一种基于优先级的成对组合测试方法

    公开(公告)号:CN102855185A

    公开(公告)日:2013-01-02

    申请号:CN201210257973.4

    申请日:2012-07-24

    Applicant: 河海大学

    Abstract: 本发明公开了一种基于优先级的成对组合测试方法,属于软件测试技术领域。所述成对组合测试方法通过优先级确定规则为每个待测试参数的各取值定义其优先权值;按照一维扩展策略根据待测参数各取值的优先级采用贪心算法得到M个候选测试用例;对候选测试用例编码,可以得到一个初始种群,然后用本发明提出的遗传算法对其进化,当遗传算法停止时,选取其中最优的个体,将其加入测试用例集;根据测试条件限制执行上述步骤一定的次数,测试时按照测试用例集中所获得的测试用例的先后顺序进行测试。本发明解决了在资源有限情况下关键参数及组合无法充分测试、测试用例生成时间过长、缺陷检测率无法通过等问题。

    一种基于Lucene的桌面搜索系统及方法

    公开(公告)号:CN102819592A

    公开(公告)日:2012-12-12

    申请号:CN201210280166.4

    申请日:2012-08-08

    Applicant: 河海大学

    Abstract: 本发明公开一种基于Lucene的桌面搜索系统及方法,所述系统在Lucene的基础上扩充了中文处理和文本分析功能,包括四个模块:索引文件构建模块、索引文件实时更新模块、索引文件定时更新模块和用户交互模块。方法包括以下步骤:扫描存储在本地磁盘上包含文本信息的文件,提取文件的名称、路径、内容等关键信息,建立倒排索引;监控对文件删除与修改等操作,更新索引,确保文件和索引信息一致;接收用户的查询请求,读取查询请求对应的索引,并进行相似度计算,将查询结果由高到低排列返回给用户,帮助用户快速而准确的定位所需信息。本发明实时性好、占用资源少,拥有较高的查全率和查准率。

    一种基于语义的水利领域信息检索系统及方法

    公开(公告)号:CN102799677A

    公开(公告)日:2012-11-28

    申请号:CN201210253882.3

    申请日:2012-07-20

    Applicant: 河海大学

    Abstract: 本发明公开一种基于语义的水利领域信息检索系统及方法。系统包括如下模块:信息获取与存储模块,用于从互联网获取水利主题信息,存储到水利主题资源库并构建索引;语义本体模块,用于存储水利领域本体和知网语义本体,并完成领域词汇相似度的计算;语义查询处理模块。方法利用模糊资源描述框架对领域信息进行描述,采用Lucene对水利信息资源构建索引;以水利公文主题词表为基础构建出利领域本体,通过Jena推理机结合水利本体对水利专业词汇进行语义扩展,以Hownet为基础实现对通用词汇进行语义扩展;利用改进的知网语义词汇相似度计算方法计算扩展词汇与检索词的相关度。本发明对检索词进行语义扩展,提高了信息的查全率和查准率。

    一种基于Lucene的桌面搜索系统及方法

    公开(公告)号:CN102819592B

    公开(公告)日:2015-06-03

    申请号:CN201210280166.4

    申请日:2012-08-08

    Applicant: 河海大学

    Abstract: 本发明公开一种基于Lucene的桌面搜索系统及方法,所述系统在Lucene的基础上扩充了中文处理和文本分析功能,包括四个模块:索引文件构建模块、索引文件实时更新模块、索引文件定时更新模块和用户交互模块。方法包括以下步骤:扫描存储在本地磁盘上包含文本信息的文件,提取文件的名称、路径、内容等关键信息,建立倒排索引;监控对文件删除与修改等操作,更新索引,确保文件和索引信息一致;接收用户的查询请求,读取查询请求对应的索引,并进行相似度计算,将查询结果由高到低排列返回给用户,帮助用户快速而准确的定位所需信息。本发明实时性好、占用资源少,拥有较高的查全率和查准率。

Patent Agency Ranking