用于可变模式的XML文档的XML查询方法和系统

    公开(公告)号:CN101571863B

    公开(公告)日:2012-03-28

    申请号:CN200810095594.3

    申请日:2008-04-29

    CPC classification number: G06F17/30929 G06F17/30932

    Abstract: 本发明涉及一种XML查询方法和系统,尤其涉及基于可变模式的一个或多个XML文档的XML查询方法和系统。包括提取文档的元素之间的嵌套关系;提取文档的元素的锚点以及锚点之间的嵌套关系;接收所输入的查询,把预定的约束规则施加到查询;基于所提取的元素之间的嵌套关系,推理出XML查询所包含的被查询元素在所述一个或多个XML文档的每个文档中的树结构,以及基于所述树结构写出所述一个或多个XML文档中每个文档的XQuery/XPath,从而可以得到每个文档的查询结果。

    生成语义网络的分层可视化的方法和装置

    公开(公告)号:CN1658234B

    公开(公告)日:2010-05-26

    申请号:CN200410004288.6

    申请日:2004-02-18

    CPC classification number: G06N5/02

    Abstract: 本发明提供了生成语义网络的可视化层次结构的方法和装置、浏览语义网络的方法以及语义网络浏览器。所述语义网络包括多个概念和多个用于连接两个概念之间的关系实例,本发明的生成语义网络的可视化层次结构的方法,包括:根据所述语义网络中所述多个概念的连接关系,确定所述概念之间的相似性;以及将相似性高的概念逐一合并,从而形成所述语义网络的可视化层次结构。

    自动评估病历质量的方法和系统

    公开(公告)号:CN101571890A

    公开(公告)日:2009-11-04

    申请号:CN200810091269.X

    申请日:2008-04-28

    CPC classification number: G06F19/324 G06F19/00 G06Q50/22 G06Q50/24

    Abstract: 提供了一种用于自动评估病历质量的方法和系统,该方法包括:形成关于标准病历的标准事实的知识库;由待评估病历生成临时事实;由所述临时事实构造针对所述知识库的查询;通过推理引擎执行针对所述知识库的所述查询;以及根据所述查询的结果判断所述待评估病历的质量。本发明节省了病历质量评估的人力和时间,增强了对病历准确性的评估能力,并避免了人工评估的主观因素影响,并且易于实现,易于扩展和增强。

    电子文档的注释方法、装置和系统

    公开(公告)号:CN100555264C

    公开(公告)日:2009-10-28

    申请号:CN200310101726.6

    申请日:2003-10-21

    Inventor: 潘越 张俐

    CPC classification number: G06F17/241

    Abstract: 本发明提供了一种电子文档的注释方法,创建、修改和浏览电子文档中注释的方法,以及电子文档的注释编辑、浏览装置和系统。所述电子文档的注释方法包括:将用于一个或多个电子文档的注释内容保存在共享词典中;以及当读者浏览电子文档时,根据所述共享词典,向读者提供该电子文档的注释。

    基于网状关系维的数据处理方法和系统

    公开(公告)号:CN101093495A

    公开(公告)日:2007-12-26

    申请号:CN200610094080.7

    申请日:2006-06-22

    CPC classification number: G06F17/30427 G06F17/30412

    Abstract: 本发明提供一种基于网状关系维的数据处理方法和系统。其中,描述应对具有网状关系的实体和/或所述实体之间的关系的属性执行的聚合作为聚合条件;描述具有网状关系的实体之间的关系的传递规则作为限制条件;将所述聚合条件和所述限制条件转换为由数据库操纵语言所描述的语句。本发明使用简洁的描述方式对网状关系维进行描述,并能够高效地将该描述转换为标准的数据库操纵语言。

    基于网页页面布局提取网页核心内容的系统、方法和程序

    公开(公告)号:CN1786947A

    公开(公告)日:2006-06-14

    申请号:CN200410100059.4

    申请日:2004-12-07

    Abstract: 提供一种提取网页的核心内容的网页核心内容提取系统和方法,该系统接收HTML文档(网页)并从其中提取核心内容,所述系统包括:文本块分析器,用于以HTML标记作为定界符将输入的HTML文档中的每个有用基本结构中的文本片断分段为一个或多个独立的文本块,并将出现在每个有用基本结构中的所有文本块依次连接起来作为输出,其中所述有用基本结构为包含网页核心内容的基本结构;以及文本块检查器,用于从文本块分析器依次输出的所述文本块中去除不含网页的核心内容的文本块并输出余下的文本块作为网页核心内容。通过针对每个文本块确定是否含有广告和导航信息,从而能够精确地确定网页中包括的核心内容。本发明还提高了处理效率。

    生成语义网络的分层可视化

    公开(公告)号:CN1658234A

    公开(公告)日:2005-08-24

    申请号:CN200410004288.6

    申请日:2004-02-18

    CPC classification number: G06N5/02

    Abstract: 本发明提供了生成语义网络的可视化层次结构的方法和装置、浏览语义网络的方法以及语义网络浏览器。所述语义网络包括多个概念和多个用于连接两个概念之间的关系实例,本发明的生成语义网络的可视化层次结构的方法,包括:根据所述语义网络中所述多个概念的连接关系,确定所述概念之间的相似性;以及将相似性高的概念逐一合并,从而形成所述语义网络的可视化层次结构。

    预存储RDF三元数据的方法和装置

    公开(公告)号:CN102479239B

    公开(公告)日:2016-03-09

    申请号:CN201010577037.2

    申请日:2010-11-29

    Abstract: 提供了预存储RDF三元数据的方法和装置。所述方法包括:获取对RDF三元组的查询请求,其中包括至少一个三元模式;对于每个三元模式,确定其对应的基本模式,并将每个三元模式相对于对应的基本模式进行加权;基于加权的基本模式,统计每个基本模式的出现频率;至少根据所述出现频率,选择至少一个基本模式;以及将所选择的至少一个基本模式所对应的RDF三元组预存储到缓存区。还提供了与之相应的装置。通过上述方法和装置,可以确定访问频率较高的RDF三元组,将这部分三元组预存储到易于访问的缓存区中,由此提高查询效率。

Patent Agency Ranking