-
公开(公告)号:CN103902585A
公开(公告)日:2014-07-02
申请号:CN201210580016.5
申请日:2012-12-27
Applicant: 中国移动通信集团公司
CPC classification number: G06F16/283 , H04L67/2852
Abstract: 本申请公开了一种数据加载方法和系统。该方法包括:配置数据块标识ID与收集点的映射关系,在收集点出现故障时,将该出现故障的收集点映射的数据块ID重新配置为与其他未出现故障的收集点相映射;将需要加载的数据按照预设规则划分为数据块,并为每个数据块赋予ID,获取数据块ID与收集点的映射关系,根据该映射关系,将数据块发给该数据块ID映射的收集点;收集点将数据块写入到数据仓库。应用本发明能够解决由于收集节点出现故障而导致部分数据无法加载到数据仓库的问题。
-
公开(公告)号:CN102193917B
公开(公告)日:2014-03-26
申请号:CN201010115869.2
申请日:2010-03-01
Applicant: 中国移动通信集团公司
IPC: G06F17/30
Abstract: 本发明的实施例公开了一种数据处理和查询的方法和装置,该处理方法包括:为数据建立第一级索引,所述数据存储在至少一个文件中,所述第一级索引用于索引各文件,所述文件中存储有相应的数据;在各文件中分别建立第二级索引,所述第二级索引用于在相应文件中索引相应的数据。该查询方法包括:根据接收到的数据查询请求、利用第一级索引在各个文件中查找,得到查询到的文件,该文件存储有该查询请求所查询的数据;根据所述数据查询请求、利用第二级索引在所查询到的文件中查找,得到该查询请求所查询的数据。通过本发明,提高了大量数据的查询速度。
-
公开(公告)号:CN103108000A
公开(公告)日:2013-05-15
申请号:CN201110351929.5
申请日:2011-11-09
Applicant: 中国移动通信集团公司
IPC: H04L29/08
Abstract: 本申请提供了大规模并行计算系统中的任务同步方法、任务同步系统、任务同步系统中的主节点及任务同步系统中的工作节点。根据本申请,大规模并行计算系统中的任务同步方法包括主节点将一个作业中的多个任务分配给多个工作节点;每个工作节点在完成分配给该工作节点的属于同一作业的所有任务后向主节点发送同步消息;以及在接收到所有工作节点发送的同步消息后,主节点确定该作业完成一个超步。根据本申请,在每个工作节点完成分配给该工作节点的属于同一作业的所有任务后向主节点发送同步消息,避免了每个任务完成后直接向主节点发送同步消息,从而降低了主节点的负载和网络通信量。
-
公开(公告)号:CN103106207A
公开(公告)日:2013-05-15
申请号:CN201110355678.8
申请日:2011-11-10
Applicant: 中国移动通信集团公司
IPC: G06F17/30
Abstract: 本发明公开了一种对象存储系统中元数据分布的方法和设备,其主要内容包括:根据元数据服务器集群中各MDS存储能力的大小,为每个MDS分配独立子区间,并根据元数据在对象存储系统中的全局唯一标识运算后的运算结果与所述独立子区间之间的映射关系,确定该运算结果所属的独立子区间,将该元数据分布至该独立子区间所对应的MDS,利用该元数据服务器对该元数据进行管理,由于元数据在元数据服务器集群中的分布充分考虑到了MDS的存储能力,存储能力越强的MDS所管理的元数据越大,确保了元数据在元数据服务器集群中分布的均衡性。
-
公开(公告)号:CN103092885A
公开(公告)日:2013-05-08
申请号:CN201110347637.4
申请日:2011-11-07
Applicant: 中国移动通信集团公司
IPC: G06F17/30
Abstract: 本发明公开了一种稀疏索引的建立方法和装置:针对每个待处理的数据记录,分别利用同一散列函数计算其键值的散列值,并根据计算出的散列值将该数据记录保存到对应的分区中,保存到同一分区中的数据记录具有相同的散列值;对于任一分区,初始阶段,其中的内容为空,当所保存的数据记录达到预定要求时,利用所保存的数据记录组成一个文件块,当所保存的未组成文件块的数据记录再次达到预定要求时,利用未组成文件块的数据记录组成另一个文件块,依次类推;每组成一个文件块,则为该文件块建立一个索引项;应用上述方法和装置,能够加快稀疏索引的建立速度。本发明同时公开了一种稀疏索引以及基于该稀疏索引的查询方法和装置。
-
公开(公告)号:CN102547756A
公开(公告)日:2012-07-04
申请号:CN201010612653.7
申请日:2010-12-29
Applicant: 中国移动通信集团公司
IPC: H04W16/18
Abstract: 本发明公开了一种数据处理系统、节点及方法,用以均质化部署分发节点和计算节点,从而简化数据处理系统的维护难度,提高系统资源使用率。所述数据处理系统,包括至少两个数据处理节点,每一个数据处理节点包括:分发模块,用于根据接收到的控制指令进入暂停状态或者工作状态;以及在工作状态下,从数据源获取需要处理的数据,并按照预先配置的分发规则进行数据分发;计算模块,用于根据接收到的控制指令进入暂停状态或者工作状态;以及接收需要处理的数据,并在工作状态下按照预先配置的处理规则进行数据处理;控制模块,用于获取根据获取到的系统参数信息及预先配置的状态控制策略,分别生成相应的控制指令下发给分发模块和计算模块。
-
公开(公告)号:CN102411584A
公开(公告)日:2012-04-11
申请号:CN201010291290.1
申请日:2010-09-25
Applicant: 中国移动通信集团公司
IPC: G06F17/30
Abstract: 本发明公开了一种数据搜索方法及系统,包括:采集网页数据和专业数据;并根据采集的网页数据和专业数据分别建立网页数据记录库和专业数据记录库,其中,网页数据记录库中包括若干个网页数据记录,专业数据记录库中包括若干个专业数据记录;并分别建立关键字与网页数据记录的第一索引和关键字与专业数据记录的第二索引;并在接收到用户的第一搜索请求后,按照第一搜索请求中携带的检索关键字查询建立的第一索引和第二索引,获得与检索关键字对应的各网页数据记录和各专业数据记录以及将获得的各网页数据记录和各专业数据记录作为第一搜索结果返回给用户。采用本发明实施例提供的方案,能够为用户提供更准确的信息搜索。
-
公开(公告)号:CN102375852A
公开(公告)日:2012-03-14
申请号:CN201010261159.0
申请日:2010-08-24
Applicant: 中国移动通信集团公司
IPC: G06F17/30
Abstract: 公开了一种在数据库中查询数据的方法、数据库查询系统和建立数据库索引的方法。在数据库中查询数据的方法包括:接收数据查询指令并确定所述数据查询指令中包括的索引键值;确定所述索引键值是用于近似索引还是精确索引;如果确定的结果是所述索引键值是用于近似索引,则通过所述索引键值,从所述近似索引在单位存储空间中标识的位置开始扫描查询数据记录,以及如果确定的结果是所述索引键值是用于精确索引,则通过所述索引键值在所述单位存储空间中标识的位置处查询数据记录。
-
公开(公告)号:CN101727465B
公开(公告)日:2011-12-21
申请号:CN200810225486.3
申请日:2008-11-03
Applicant: 中国移动通信集团公司
IPC: G06F17/30
CPC classification number: G06F17/30321 , G06F17/30315
Abstract: 本发明公开了一种分布式列存储数据库索引建立方法、查询方法及装置与系统。该分布式列存储数据库索引建立方法包括:获取分布式列存储数据库中的列字段,生成以所述列字段作为关键字的列索引文件,所述列索引文件中包含所述列字段在所述分布式列存储数据库中的值与对应的Row字段值的映射关系;存储所述列索引文件到所述分布式列存储数据库中与所述列字段对应的索引目录下。客户端发起以列字段作为查询条件和查询结果的查询请求时,通过匹配出相应的列索引文件,得到对应的Row字段值,从而实现索引查询。采用本发明能在现有分布式列存储数据库中,实现除Row字段外的其它列字段快速查询。
-
公开(公告)号:CN102033870A
公开(公告)日:2011-04-27
申请号:CN200910092777.4
申请日:2009-09-24
Applicant: 中国移动通信集团公司
IPC: G06F17/30
Abstract: 本发明实施例提供一种数据查找方法及装置,用以解决采用现有技术提供的数据查找方式的查找效率比较低的问题。其中,本发明实施例提供的该方法包括步骤:数据查找装置获得用户提供的数据查找条件;根据所述数据查找条件,按照预设的行关键字所在范围的确定方式,确定用户需要查找的数据在数据存储系统中所在行对应的行关键字所在范围;所述数据查找装置根据所述确定的范围,从预先按照预设的行关键字确定方式确定的、与数据存储系统中各行数据分别对应的行关键字中,确定处于所述确定的范围内的行关键字;所述数据查找装置根据所述确定的行关键字,查找与所述确定的行关键字对应的行中的数据。
-
-
-
-
-
-
-
-
-