-
公开(公告)号:CN102929898B
公开(公告)日:2017-08-15
申请号:CN201110238260.9
申请日:2011-08-12
Applicant: 微软技术许可有限责任公司
IPC: G06F17/30
Abstract: 本发明揭示了一种结构化数据库的语义查询引擎。该语义查询引擎从一个或多个不同的数据来源获得未加工的数据,利用数据加工装置依据应用程序的要求对未加工的数据进行加工。加工后的数据被保存在数据存放库中,在数据存放库中,经加工的数据被以一种或多种模型保存以形成数据实体。基于本体(ontology)创建的共享全局数据模型提供本体实体。本体实体与数据实体之间进行映射。数据存放库中的经加工的数据的模型、共享全局数据模型、以及数据存放库中的数据实体与共享全局数据模型中的本体实体之间的映射关系都由元数据进行描述。
-
公开(公告)号:CN102955796B
公开(公告)日:2017-06-27
申请号:CN201110245084.1
申请日:2011-08-16
Applicant: 微软技术许可有限责任公司
IPC: G06F17/30
Abstract: 本发明公开了一种基于频繁子树来导出记录模板的方法。该方法包括从网页中挖掘最大频繁子树和闭合频繁子树,对从网页挖掘出的最大频繁子树和闭合频繁子树进行分组。在分组内标识模板子树,该模板子树是仅包括所有必要节点的模板。基于标识出的模板子树来标识可选节点并消除噪音。并基于模板子树从各个节点中抽取结构化信息。
-