一种数据查询操作的实现方法、装置及系统

    公开(公告)号:CN103092886B

    公开(公告)日:2016-03-02

    申请号:CN201110347659.0

    申请日:2011-11-07

    Abstract: 本发明公开了一种数据查询操作的实现方法、装置及系统,对外部数据系统的数据表执行查询操作后,将查询到的数据缓存到临时表中;对临时表中缓存的数据增加索引后,将临时表中的所有数据均匀分配给各数据交换节点,确定其对应的索引范围。本发明通过建立临时表缓存查询到的数据,各个数据交换节点就可以直接并行地对缓存表中的部分数据进行读取操作,避免了每个数据交换节点都需要并行地在外部系统中进行复杂的查询操作,减轻了在处理大量数据时外部数据系统服务器的负担,并且,由于分配给各数据交换节点的临时表中的索引范围对应的数据行数相对平均,保证了各个数据交换节点在并行处理时运行时间能够基本相同,从而提高了整体的查询效率。

    一种网页分类方法和设备

    公开(公告)号:CN102955810B

    公开(公告)日:2015-12-02

    申请号:CN201110249270.2

    申请日:2011-08-26

    Abstract: 本发明公开了一种网页分类方法和设备,该方法利用现有URL类别库中的记录,建立虚拟的层级URL,并对层级URL的类别进行预测。当需要对待分类网页进行分类时,根据待分类网页的URL查询URL类别库;如果未查询到匹配的URL,则根据该URL的上层URL查询URL类别库,并在查询到匹配的URL时,根据查询到的URL的预测类别确定待分类网页的类别。在本发明中,提高了网页分类的效率和成功率。

    一种MapReduce系统及其调度任务的方法和装置

    公开(公告)号:CN102387173B

    公开(公告)日:2015-02-04

    申请号:CN201010270583.1

    申请日:2010-09-01

    Abstract: 本发明提供了一种MapReduce系统及其调度任务的方法和装置。该方法包括:预先配置多种调度器、将系统资源划分为多个资源子网,并预先配置所述调度器与所述资源子网的对应关系;其中,每种调度器包括任务队列和调度策略;接收工作节点的任务请求,从该工作节点所在的资源子网对应的所有调度器中选择调度器,根据选出的调度器的调度策略从该调度器的任务队列中调度任务,将调度出的任务返回给该工作节点。应用本发明能够提高系统进行任务调度的灵活性,增加了系统的适用场景。

    一种数据挖掘系统中数据聚类的方法、系统及装置

    公开(公告)号:CN102141988B

    公开(公告)日:2014-09-10

    申请号:CN201010102976.1

    申请日:2010-01-28

    Abstract: 本发明公开了一种数据挖掘系统中数据聚类的方法、系统及装置,主要包括:A、主控节点将分块数据对象分发给至少两个计算节点;B、以串行方式或并行方式控制每个计算节点计算利用保存的数据对象中的非中心点对象分别替换设定个中心点对象后对应的替换代价;C、获取每个计算节点的执行结果,并是否存在小于零的替换代价;若是,确定替换同一中心点对象的多个非中心点对象中最小替换代价的非中心点对象,替换中心点对象,并返回步骤B;若否,则将当前各中心点对象及对应簇确定为最终聚类结果。根据该技术方案,提高了计算效率,并且应用于海量数据的处理需求。

    查询数据的系统、方法和数据管理系统

    公开(公告)号:CN102117305B

    公开(公告)日:2013-09-11

    申请号:CN201010000163.1

    申请日:2010-01-06

    Abstract: 本发明公开了查询数据的系统、方法和数据管理系统。所述查询数据的系统包括:存储媒介,存储有多个数据、以及为所述多个数据创建并与之绑定的次索引;索引元数据管理模块,用于管理从存储于数据库的基表数据中获取索引元数据,其中,所述索引元数据用于根据预定规则创建所述多个数据;以及索引数据管理模块,用于根据从用户端接收的操作指令,通过绑定的所述次索引在所述存储媒介中查询到要操作的数据。

    一种社交网络分析方法和装置

    公开(公告)号:CN103138981A

    公开(公告)日:2013-06-05

    申请号:CN201110391293.7

    申请日:2011-11-30

    Abstract: 本发明公开了一种社交网络分析方法和装置。其中该方法包括:根据社交网络文件生成针对每个节点的节点信息;控制所述社交网络中所有节点根据相应的节点信息进行遍历,遍历所述社交网络所有节点后,得到所述社交网络的拓扑特征值。本发明通过采用多个节点同时并发的机制,即所有节点都并行推送遍历信息,解决了社交网络中需要多次迭代才能遍历完数据的问题,降低了分析的时间复杂度,提高分析效率。

    一种数据查询操作的实现方法、装置及系统

    公开(公告)号:CN103092886A

    公开(公告)日:2013-05-08

    申请号:CN201110347659.0

    申请日:2011-11-07

    Abstract: 本发明公开了一种数据查询操作的实现方法、装置及系统,对外部数据系统的数据表执行查询操作后,将查询到的数据缓存到临时表中;对临时表中缓存的数据增加索引后,将临时表中的所有数据均匀分配给各数据交换节点,确定其对应的索引范围。本发明通过建立临时表缓存查询到的数据,各个数据交换节点就可以直接并行地对缓存表中的部分数据进行读取操作,避免了每个数据交换节点都需要并行地在外部系统中进行复杂的查询操作,减轻了在处理大量数据时外部数据系统服务器的负担,并且,由于分配给各数据交换节点的临时表中的索引范围对应的数据行数相对平均,保证了各个数据交换节点在并行处理时运行时间能够基本相同,从而提高了整体的查询效率。

    数据查找方法及装置
    28.
    发明授权

    公开(公告)号:CN102033870B

    公开(公告)日:2013-04-24

    申请号:CN200910092777.4

    申请日:2009-09-24

    Abstract: 本发明实施例提供一种数据查找方法及装置,用以解决采用现有技术提供的数据查找方式的查找效率比较低的问题。其中,本发明实施例提供的该方法包括步骤:数据查找装置获得用户提供的数据查找条件;根据所述数据查找条件,按照预设的行关键字所在范围的确定方式,确定用户需要查找的数据在数据存储系统中所在行对应的行关键字所在范围;所述数据查找装置根据所述确定的范围,从预先按照预设的行关键字确定方式确定的、与数据存储系统中各行数据分别对应的行关键字中,确定处于所述确定的范围内的行关键字;所述数据查找装置根据所述确定的行关键字,查找与所述确定的行关键字对应的行中的数据。

    数据访问方法、节点及系统

    公开(公告)号:CN102594852A

    公开(公告)日:2012-07-18

    申请号:CN201110005099.0

    申请日:2011-01-04

    Inventor: 王旭 罗治国

    Abstract: 本发明公开了一种数据访问方法、装置及系统,其中,该方法包括:接收包含块编号标识的访问请求;预建立的本地块单元根据块编号标识查找本地块单元的块编号与提供存储服务的存储节点资源信息的对应关系,获得块编号标识对应的存储节点位置以及块数据标识;本地块单元根据块编号标识对应的存储节点位置以及块数据标识,向存储节点发送块数据访问请求;其中,存储节点资源信息包括提供存储服务的存储节点位置信息及存储节点的块数据标识。本发明可以解决现有分布式文件系统每次访问需要通过元数据服务器进行寻址,元数据服务器成为系统的瓶颈,访问效率低的缺陷。

    一种虚拟机访问权限的控制方法、系统及装置

    公开(公告)号:CN102571698A

    公开(公告)日:2012-07-11

    申请号:CN201010594536.2

    申请日:2010-12-17

    Abstract: 本发明公开了一种虚拟机访问权限的控制方法、系统及装置,主要技术方案包括:接收第一虚拟机发送的对第二虚拟机的访问请求;根据所述访问请求,确定第一虚拟机以及该第二虚拟机分别对应的安全标识;在比较确定的安全标识一致后,允许该第一虚拟机访问第二虚拟机。根据该技术方案,能够根据虚拟机的安全标识确定是否允许第一虚拟机对第二虚拟机的访问,从而实现了根据虚拟机的安全性要求对虚拟机的安全控制。

Patent Agency Ranking