搜索方法
    3.
    发明公开

    公开(公告)号:CN104246760A

    公开(公告)日:2014-12-24

    申请号:CN201280072817.9

    申请日:2012-07-30

    发明人: S.戈兰 O.巴科尔

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30864 G06F17/3053

    摘要: 本发明的实施例提供从数据集生成搜索结果的方法,该方法包括:基于第一查询来获得第一搜索结果,该搜索结果包括多个文档;将权值分配到第一搜索结果的一个或多个文档;至少部分地基于所分配的权值来计算存在于搜索结果的一个或多个文档中的用语的相关性;以及基于第二查询来获得第二搜索结果,其中第二查询包括具有最高的计算的相关性的一个或多个用语。

    对准文档的字段的注解
    4.
    发明公开

    公开(公告)号:CN103999079A

    公开(公告)日:2014-08-20

    申请号:CN201180075990.X

    申请日:2011-10-27

    IPC分类号: G06F17/21 G06F17/00

    CPC分类号: G06F17/241 G06F17/3071

    摘要: 本发明提供了对准文档的字段的注解的方法和系统。访问训练信息,该训练信息包括关于与针对文档类型的文档的训练群集相关联的多个字段中的每个的特征的第一测量信息的。以第一名称对第一训练群集进行注解并且以第二名称对第二训练群集进行注解。基于训练信息生成电子分类模型。访问用于与新文档的新群集相关联的字段的特征的第二测量信息。基于第二测量信息使用分类模型对新群集中的每个自动地注解。例如,以第一名称对具有第一字段类型的字段的第一新群集进行注解并且以第二名称对具有第二字段类型的字段的第二新群集进行注解。