XML关键字检索的基于栈的回退处理方法

    公开(公告)号:CN101782926A

    公开(公告)日:2010-07-21

    申请号:CN201010022508.3

    申请日:2010-01-07

    Applicant: 复旦大学

    Inventor: 杨卫东 朱皓

    Abstract: 本发明属于可扩充标记语言(XML)数据管理技术领域,具体为一种针对XML文档的关键字检索方法。该方法包括:1.形式化定义了XML的关键字搜索语义:互斥最低公共祖先,并由此定义了XML文档树上的簇和返回结果;2.提出一个基于栈的回退算法,记为XKII,来进行XML数据库的关键字搜索;3.提出每个返回结果的熵的概念,并以此作为一个评分模型对关键字检索的结果进行排序。本发明方法能够有效支持XML文档或数据库的关键字检索,可应用于互联网上的XML文档的检索和企业信息系统中的XML数据库的检索。

    基于部分二进制前缀编码的XML流缓存管理方法

    公开(公告)号:CN101089851A

    公开(公告)日:2007-12-19

    申请号:CN200710043705.1

    申请日:2007-07-12

    Applicant: 复旦大学

    Abstract: 本发明属于可扩充标记语言(XML)管理技术领域,具体为一种基于部分二进制前缀编码的XML流缓存管理方法。该方法包括:通过运行时栈驱动的基于二进制的前缀编码,在运行时确定结果集中节点之间的关系,避免中间结果集之间的连接操作;定义一个查询的“最低公共祖先谓词节点”,以便尽早删除缓存中的节点,处理在XQuery查询中包含“∥”并且XML文档中含有递归、嵌套结构的情况;缓存管理方法同时处理多个含有复杂谓词的XQuery查询,并支持多个XQuery查询结果中公共缓存节点的共享。本发明能够有效支持针对XQuery查询的XML流的缓存管理,缓存的效率明显提高,可应用于基于Web的个性化推荐服务、信息监测等领域。

    基于部分二进制前缀编码的XML流缓存管理方法

    公开(公告)号:CN101089851B

    公开(公告)日:2012-06-13

    申请号:CN200710043705.1

    申请日:2007-07-12

    Applicant: 复旦大学

    Abstract: 本发明属于可扩充标记语言(XML)管理技术领域,具体为一种基于部分二进制前缀编码的XML流缓存管理方法。该方法包括:通过运行时栈驱动的基于二进制的前缀编码,在运行时确定结果集中节点之间的关系,避免中间结果集之间的连接操作;定义一个查询的″最低公共祖先谓词节点″,以便尽早删除缓存中的节点,处理在XQuery查询中包含″//″并且XML文档中含有递归、嵌套结构的情况;缓存管理方法同时处理多个含有复杂谓词的XQuery查询,并支持多个XQuery查询结果中公共缓存节点的共享。本发明能够有效支持针对XQuery查询的XML流的缓存管理,缓存的效率明显提高,可应用于基于Web的个性化推荐服务、信息监测等领域。

    针对可扩充标记语言数据库的关键字检索方法及其装置

    公开(公告)号:CN101571866A

    公开(公告)日:2009-11-04

    申请号:CN200910052199.1

    申请日:2009-05-27

    Applicant: 复旦大学

    Inventor: 杨卫东 朱皓

    Abstract: 一种针对可扩充标记语言数据库的关键字检索方法,包括如下步骤:采用基于栈的回退算法,来进行可扩充标记语言数据库的关键字搜索;对每个返回结果的熵作为一个评分模型,对关键字检索的结果进行排序。本发明还提供了一种针对可扩充标记语言数据库的关键字检索装置。本发明的优点在于,引入熵的概念对返回的结果进行评价,因此优化基于栈的回退算法的所获结果的排序结果,能够将符合用户搜索意愿的结果排在靠前的位置。

    基于语义距离模型的XML文档关键字搜索聚类方法

    公开(公告)号:CN101241502A

    公开(公告)日:2008-08-13

    申请号:CN200810034546.3

    申请日:2008-03-13

    Applicant: 复旦大学

    Inventor: 杨卫东 朱皓

    Abstract: 本发明属于Web数据管理技术领域,具体为一种基于语义距离模型的可扩充标记语言(XML)的关键字搜索方法,称为XKLuster。本发明提出一种新的模型,称为“XML关键字语义距离模型”。它通过更全面地考虑XML的层次结构特征来度量XML关键字搜索的语义;基于本发明提出的“XML关键字语义距离模型”,从不同的角度,设计三种聚类算法:基于图的关键字聚类算法(GKSC)、核心集驱动的关键字聚类算法(CKSC)和松弛的核心集驱动聚类算法(LCC);提出一种排序模型对所有的搜索结果进行排序,以便将搜索结果返回给用户。与已有方法相比,本发明提出的方法可得到更加合理的返回结果。本发明可用于互联网上的XML文档搜索、XML数据库的搜索等领域。

Patent Agency Ranking