一种结合聚类和双key值的高维向量检索方法

    公开(公告)号:CN103500165A

    公开(公告)日:2014-01-08

    申请号:CN201310365592.2

    申请日:2013-08-21

    CPC classification number: G06F16/43 G06F16/41

    Abstract: 本发明是一种结合聚类和双key值的高维向量检索方法。在本发明中,提出了一种结合聚类的双key值索引结构CDKB-tree,它首先采用聚类算法对高维向量集进行簇划分,然后为各簇数据构建双key值扩展B+-tree,形成CDKB-tree。进行检索时,只需对与查询范围相交的簇数据进行搜索,通过聚类实现第一次过滤,并通过主key和辅key(双key值),实现两次key值过滤,只需对主key和辅key均在搜索范围内的那些高维向量与查询向量间进行相似度匹配计算。本发明提出的索引结构通过聚类及简单的双key值大小比较,大大地减少了相似度匹配的运算量,极大地加快了检索速度。

    基于格网的多比例尺海量数据空间渲染方法

    公开(公告)号:CN106682001A

    公开(公告)日:2017-05-17

    申请号:CN201510750559.0

    申请日:2015-11-05

    CPC classification number: G06F17/30241

    Abstract: 本发明提供一种基于格网的多比例尺海量数据空间渲染方法,包括:服务器得到每个矢量数据所对应的n条矢量数据属性组;服务器接收前端发送的空间数据查询请求;服务器基于所述查询关键字,获得每条矢量数据在当前比例尺下的1条矢量数据属性组;服务器预定义聚类规则,然后,基于所述聚类规则,对绑定有矢量数据属性组的格网进行聚类计算,得到若干个聚类,并计算得到每个聚类的聚类中心点地理坐标以及每个聚类所包含的矢量数据属性组的数量,前端根据预定义的数据渲染规则,进行渲染。优点为:可以较为完整地实现大数据可视化分析中矢量数据快速显示、多尺度动态渲染以及无数据压盖显示等需求,从而提高客户使用体验。

    一种基于高分散哈希算法的数据采集策略方法及装置

    公开(公告)号:CN105208075A

    公开(公告)日:2015-12-30

    申请号:CN201510492674.2

    申请日:2015-08-12

    CPC classification number: H04L67/2842 H04L9/0643

    Abstract: 一种基于高分散哈希算法的数据采集策略方法及装置,该装置包括用户行为采集模块、时间种子生成器、哈希回传时间生成器、时间校正器、定时服务模块、数据传输模块、文件缓存模块、后台接收服务模块;该装置将高分散性哈希算法引入,计算合理的回传时间;数据传输模块及数据加密器等用于将数据进行加密后传输;文件缓存、传输计数器、启动计数器等用于测算数据传输成功率。本发明利用高分散性哈希算法的天然特质,在对实时性要求不高的移动互联网数据采集系统中,有效的将大量的设备发送请求进行了分散疏导,合理的利用服务器的资源情况,将其服务能力平均化,同时也可以将数据回传的延时降到最低,实现系统的均衡、稳定的目标。

    基于语义标签库的多维度内容标注方法

    公开(公告)号:CN102982076B

    公开(公告)日:2015-08-19

    申请号:CN201210424525.9

    申请日:2012-10-30

    Abstract: 本发明公开了一种基于语义标签库的多维度内容标注方法,包括:建立语义标签库;配置可扩展的资源种类;建立多级、可配置的内容标注维度;将资源按照内容特征划分维度,建立多层次的内容维度;建立可配置、可修改的资源种类与内容标注维度的对应关系;进行基于语义标签库的资源内容标注;临时标签处理;基于语义标签库的资源检索;用户输入检索词,系统自动在扩展标签库中进行匹配:如果匹配成功,系统根据对应的标签标注码来检索对应图片;如果匹配不成功,系统可将检索词与资源描述信息进行匹配,同时系统将该检索词存入临时标签库。有效的提高了资源标注的精确度和效率,为资源检索和数据分析奠定了良好的基础。

    结合聚类和街区距离的高维向量搜索方法

    公开(公告)号:CN103514264A

    公开(公告)日:2014-01-15

    申请号:CN201310365384.2

    申请日:2013-08-21

    CPC classification number: G06F17/3002 G06F17/30029

    Abstract: 本发明是结合聚类和街区距离的高维向量搜索方法。在本发明中,提出了一种结合聚类和街区距离的索引结构CBlockB-tree,它首先采用聚类算法对高维向量集进行簇划分,然后为各簇数据构建BlockB-tree,形成CBlockB-tree。该索引结构进行检索时,通过聚类能过滤一部分与查询区域不相交的簇数据,通过高维到一维转换后的key值比较,能进一步减少最终向量相似度匹配的运算量,加快高维向量的搜索速度。同时,该索引结构能够有效支持简单高效的街区距离进行匹配搜索。

    基于语义标签库的多维度内容标注方法

    公开(公告)号:CN102982076A

    公开(公告)日:2013-03-20

    申请号:CN201210424525.9

    申请日:2012-10-30

    Abstract: 本发明公开了一种基于语义标签库的多维度内容标注方法,包括:建立语义标签库;配置可扩展的资源种类;建立多级、可配置的内容标注维度;将资源按照内容特征划分维度,建立多层次的内容维度;建立可配置、可修改的资源种类与内容标注维度的对应关系;进行基于语义标签库的资源内容标注;临时标签处理;基于语义标签库的资源检索;用户输入检索词,系统自动在扩展标签库中进行匹配:如果匹配成功,系统根据对应的标签标注码来检索对应图片;如果匹配不成功,系统可将检索词与资源描述信息进行匹配,同时系统将该检索词存入临时标签库。有效的提高了资源标注的精确度和效率,为资源检索和数据分析奠定了良好的基础。

Patent Agency Ranking