- 专利标题: 使用文本分析从源文档中识别相关文档集合的系统和方法
- 专利标题(英): System and method for using text analytics to identify a set of related documents from a source document
-
申请号: CN200610110127.4申请日: 2006-07-31
-
公开(公告)号: CN100594495C公开(公告)日: 2010-03-17
- 发明人: 史蒂芬·凯恩·鲍伊尔 , 杰弗里·托马斯·克鲁伦 , 威廉·斯科特·斯班格勒 , 塔帕斯·卡努恩格 , 罗伯特·李·安格尔 , 詹姆斯·J·罗德斯 , 赫什尔·J·R·韦恩斯特劳布 , 大卫·C·马丁 , 里查德·亨尼西 , 詹姆斯·威廉·库伯
- 申请人: 国际商业机器公司
- 申请人地址: 美国纽约
- 专利权人: 国际商业机器公司
- 当前专利权人: 国际商业机器公司
- 当前专利权人地址: 美国纽约
- 代理机构: 中国国际贸易促进委员会专利商标事务所
- 代理商 吴丽丽
- 优先权: 11/281,291 2005.11.17 US
- 主分类号: G06F17/30
- IPC分类号: G06F17/30
摘要:
一种用于处理文档以便生成相关文档集合的系统和方法。提供了这样一种系统,其包括:文本分析系统,用于分析包含在源文档中的非结构化数据并且提取关于源文档的结构化信息集合;以及比较系统,用于通过比较结构化信息集合与根据出版物集合索引的元数据来识别相关文档集合。
公开/授权文献
- CN1967535A 使用文本分析从源文档中识别相关文档集合的系统和方法 公开/授权日:2007-05-23