-
公开(公告)号:CN103377199A
公开(公告)日:2013-10-30
申请号:CN201210112493.9
申请日:2012-04-16
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 提供一种信息处理装置和方法。信息处理方法包括:从图片中识别字符串作为备选;响应于得到备选字符串,根据其获取检索词;响应于检索词的获取,使用检索词来检索网页;响应于检索到的网页,对检索到的网页进行聚类;当作为聚类结果的网页类别与检索词的相关性大于等于第一预定程度但小于第二预定程度时,将该网页类别选择为第一网页类别;当网页类别与检索词的相关性大于等于第二预定程度时,将该网页类别选择为第二网页类别;响应于第一网页类别的选择,对照第一网页类别对检索词进行校验,并将校验后的检索词作为备选字符串以用于进一步获取检索词;以及基于与第二网页类别对应的检索词和预先建立的图片分类体系对图片内容主题类型进行识别。
-
公开(公告)号:CN101882142B
公开(公告)日:2012-12-26
申请号:CN200910140421.3
申请日:2009-05-08
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 公开了索引合并方法及装置。索引合并方法包括:确定索引库中是否存在不少于n个的、尺寸符合基于预定基准的预定合并条件的子索引,n为整数且大于等于2,预定基准与预定子索引的尺寸相关;如果确定存在则将确定的子索引作为子索引集;计算如果合并子索引集中的子索引将获得的新子索引的尺寸;在剩余的子索引中查找不少于m个的、尺寸符合基于与新子索引尺寸相关的基准的预定条件的子索引,m为整数且大于等于1;如果找到了则将找到的子索引加入子索引集中并对新的子索引集执行计算步骤和查找步骤;如果未找到则对子索引集中的子索引进行合并。利用根据本发明的方法和/或装置,能够在动态文本集环境下获得较稳定的优化的系统性能。
-