用缩减大小的索引进行文献检索的设备

    公开(公告)号:CN1288581C

    公开(公告)日:2006-12-06

    申请号:CN02131528.0

    申请日:2002-08-10

    Inventor: 小川泰嗣

    Abstract: 一种用于在多个登记文献中检索包括查询字符串的文献的文献检索设备,包括:文本切分单元,将登记的文献和查询字符串分成n-gram和字;n-gram索引,其中在特定n-gram的基础上存储与登记文献中出现的n-gram的具体值有关的信息;字边界位置索引,其中以压缩形式存储与登记文献中出现的字边界的具体值有关的信息;基于字符串的搜索单元,通过在所述n-gram索引中查找一个或多个n-gram的查询字符来识别包括查询字符串的一个或多个登记文献;以及基于字的搜索单元,通过在所述字边界位置索引中查找一个或多个字的查询字符串来检查查询字符串是否作为字出现在所述一个或多个识别的登记文献中,从而识别包括作为字的查询字符串的登记文献。

    文献检索的方法和装置
    6.
    发明授权

    公开(公告)号:CN1156779C

    公开(公告)日:2004-07-07

    申请号:CN00122538.3

    申请日:2000-06-09

    Inventor: 小川泰嗣

    CPC classification number: G06F16/3346 Y10S707/99932 Y10S707/99935

    Abstract: 一种进行文献检索的方法包括如下步骤:将一个查询字符串分解为部分字符串;从大量已记录的文献中选择一篇或多篇文献,这样所选择的一篇或多篇文献中的每一篇文献均包含有所有的部分字符串;计算一篇或多篇文献中的每一篇文献中的部分字符串的相应的分数;计算来自于一篇或多篇文献中的每一篇文献中的部分字符串的相应的分数的查询字符串的相应的分数。

    用缩减大小的索引进行文献检索

    公开(公告)号:CN1402160A

    公开(公告)日:2003-03-12

    申请号:CN02131528.0

    申请日:2002-08-10

    Inventor: 小川泰嗣

    Abstract: 一种用于在多个登记文献中检索包括查询字符串的文献的文献检索设备,包括:文本切分单元,将登记的文献和查询字符串分成n-gram和字;n-gram索引,其中在特定n-gram的基础上存储与登记文献中出现的n-gram的具体值有关的信息;字边界位置索引,其中以压缩形式存储与登记文献中出现的字边界的具体值有关的信息;基于字符串的搜索单元,通过在所述n-gram索引中查找一个或多个n-gram的查询字符来识别包括查询字符串的一个或多个登记文献;以及基于字的搜索单元,通过在所述字边界位置索引中查找一个或多个字的查询字符串来检查查询字符串是否作为字出现在所述一个或多个识别的登记文献中,从而识别包括作为字的查询字符串的登记文献。

    文献检索的方法和装置
    8.
    发明公开

    公开(公告)号:CN1277398A

    公开(公告)日:2000-12-20

    申请号:CN00122538.3

    申请日:2000-06-09

    Inventor: 小川泰嗣

    CPC classification number: G06F16/3346 Y10S707/99932 Y10S707/99935

    Abstract: 一种进行文献检索的方法包括如下步骤:将一个查询字符串分解为部分字符串;从大量已记录的文献中选择一篇或多篇文献,这样所选择的一篇或多篇文献中的每一篇文献均包含有所有的部分字符串;计算一篇或多篇文献中的每一篇文献中的部分字符串的相应的分数;计算来自于一篇或多篇文献中的每一篇文献中的部分字符串的相应的分数的查询字符串的相应的分数。

Patent Agency Ranking