-
-
公开(公告)号:CN101661490A
公开(公告)日:2010-03-03
申请号:CN200810213931.4
申请日:2008-08-28
Applicant: 国际商业机器公司
IPC: G06F17/30
Abstract: 搜索引擎、其客户端及搜索网页的方法。搜索引擎包含查询装置,被配置为检索出满足查询的网页序列;页面摘要提取装置,被配置为提取所述网页序列中至少一个的网页的候选页面摘要;和页面摘要选择装置,被配置为根据与发出所述查询的用户相关的词集选择所述候选页面摘要中的候选页面摘要,作为提供给所述用户的页面摘要。由于不是简单地选择包含查询关键词的文本段来形成页面摘要,而是根据反映用户的信息需求的个性化关键词来从候选页面摘要中选择最终的页面摘要,因而能够在一定程度上满足用户的个性化信息需求。
-
公开(公告)号:CN101136020A
公开(公告)日:2008-03-05
申请号:CN200610128032.5
申请日:2006-08-31
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06F17/30592 , G06Q10/06
Abstract: 本发明提供了用于自动从数据资源中提取实体参考数据的系统和方法,其能够以低成本不断从现有数据源(例如,数据仓库、web等)挖掘新的参考数据元组。本发明的系统包括:实体数据解析装置,与数据资源耦接,用于对数据资源中的实体数据进行解析,以获得每个实体数据的内部语义结构,并从所述内部语义结构产生特征集;以及数据提取装置,用于根据所述实体数据解析装置产生的特征集提取参考实体数据。根据本发明的优选实施方式,还提供存留组件,以对从数据提取装置输出的候选参考数据种子进行优化。
-
-