使用文本分析从源文档中识别相关文档集合的系统和方法

发明授权

CN100594495C 使用文本分析从源文档中识别相关文档集合的系统和方法有权

请登陆查看更多内容

专利标题： 使用文本分析从源文档中识别相关文档集合的系统和方法
专利标题（英）： System and method for using text analytics to identify a set of related documents from a source document
申请号： CN200610110127.4

申请日： 2006-07-31
公开(公告)号： CN100594495C

公开(公告)日： 2010-03-17
发明人: 史蒂芬·凯恩·鲍伊尔 , 杰弗里·托马斯·克鲁伦 , 威廉·斯科特·斯班格勒 , 塔帕斯·卡努恩格 , 罗伯特·李·安格尔 , 詹姆斯·J·罗德斯 , 赫什尔·J·R·韦恩斯特劳布 , 大卫·C·马丁 , 里查德·亨尼西 , 詹姆斯·威廉·库伯
申请人： 国际商业机器公司
申请人地址： 美国纽约
专利权人： 国际商业机器公司
当前专利权人： 国际商业机器公司
当前专利权人地址： 美国纽约
代理机构： 中国国际贸易促进委员会专利商标事务所
代理商 吴丽丽
优先权： 11/281,291 2005.11.17 US
主分类号： G06F17/30
IPC分类号： G06F17/30

摘要：

一种用于处理文档以便生成相关文档集合的系统和方法。提供了这样一种系统，其包括：文本分析系统，用于分析包含在源文档中的非结构化数据并且提取关于源文档的结构化信息集合；以及比较系统，用于通过比较结构化信息集合与根据出版物集合索引的元数据来识别相关文档集合。

摘要（英）：

A system and method for processing a document to generate a set of related documents. A system is provided that includes a textual analytics system that analyzes unstructured data contained in a source document and extracts a set of structured information about the source document; and a compare system that identifies a set of related documents by comparing the set of structured information with metadata indexed from a set of publications.

公开/授权文献

CN1967535A 使用文本分析从源文档中识别相关文档集合的系统和方法公开/授权日：2007-05-23

信息查询

中国专利公布公告 Global Dossier Espacenet