发明公开
CN103999079A 对准文档的字段的注解
无效 - 撤回
- 专利标题: 对准文档的字段的注解
- 专利标题(英): Aligning annotation of fields of documents
-
申请号: CN201180075990.X申请日: 2011-10-27
-
公开(公告)号: CN103999079A公开(公告)日: 2014-08-20
- 发明人: S.戈兰 , O.巴科尔 , R.伯格曼 , I.科亨 , G.诺伊
- 申请人: 惠普发展公司 , 有限责任合伙企业
- 申请人地址: 美国德克萨斯州
- 专利权人: 惠普发展公司,有限责任合伙企业
- 当前专利权人: 惠普发展公司,有限责任合伙企业
- 当前专利权人地址: 美国德克萨斯州
- 代理机构: 中国专利代理(香港)有限公司
- 代理商 张凌苗; 胡莉莉
- 国际申请: PCT/US2011/058043 2011.10.27
- 国际公布: WO2013/062550 EN 2013.05.02
- 进入国家日期: 2014-06-27
- 主分类号: G06F17/21
- IPC分类号: G06F17/21 ; G06F17/00
摘要:
本发明提供了对准文档的字段的注解的方法和系统。访问训练信息,该训练信息包括关于与针对文档类型的文档的训练群集相关联的多个字段中的每个的特征的第一测量信息的。以第一名称对第一训练群集进行注解并且以第二名称对第二训练群集进行注解。基于训练信息生成电子分类模型。访问用于与新文档的新群集相关联的字段的特征的第二测量信息。基于第二测量信息使用分类模型对新群集中的每个自动地注解。例如,以第一名称对具有第一字段类型的字段的第一新群集进行注解并且以第二名称对具有第二字段类型的字段的第二新群集进行注解。