一种结合聚类和双key值的高维向量检索方法

    公开(公告)号:CN103500165B

    公开(公告)日:2016-08-31

    申请号:CN201310365592.2

    申请日:2013-08-21

    Abstract: 本发明是一种结合聚类和双key值的高维向量检索方法。在本发明中,提出了一种结合聚类的双key值索引结构CDKB?tree,它首先采用聚类算法对高维向量集进行簇划分,然后为各簇数据构建双key值扩展B+?tree,形成CDKB?tree。进行检索时,只需对与查询范围相交的簇数据进行搜索,通过聚类实现第一次过滤,并通过主key和辅key(双key值),实现两次key值过滤,只需对主key和辅key均在搜索范围内的那些高维向量与查询向量间进行相似度匹配计算。本发明提出的索引结构通过聚类及简单的双key值大小比较,大大地减少了相似度匹配的运算量,极大地加快了检索速度。

    一种结合聚类和双key值的高维向量检索方法

    公开(公告)号:CN103500165A

    公开(公告)日:2014-01-08

    申请号:CN201310365592.2

    申请日:2013-08-21

    CPC classification number: G06F16/43 G06F16/41

    Abstract: 本发明是一种结合聚类和双key值的高维向量检索方法。在本发明中,提出了一种结合聚类的双key值索引结构CDKB-tree,它首先采用聚类算法对高维向量集进行簇划分,然后为各簇数据构建双key值扩展B+-tree,形成CDKB-tree。进行检索时,只需对与查询范围相交的簇数据进行搜索,通过聚类实现第一次过滤,并通过主key和辅key(双key值),实现两次key值过滤,只需对主key和辅key均在搜索范围内的那些高维向量与查询向量间进行相似度匹配计算。本发明提出的索引结构通过聚类及简单的双key值大小比较,大大地减少了相似度匹配的运算量,极大地加快了检索速度。

Patent Agency Ranking