-
公开(公告)号:CN104102710A
公开(公告)日:2014-10-15
申请号:CN201410336964.3
申请日:2014-07-15
Applicant: 浪潮(北京)电子信息产业有限公司
CPC classification number: G06F17/30575 , G06F17/30545 , G06F17/30554
Abstract: 本发明公开了一种海量数据查询方法,其特征在于,包括:建立HBase非行键值rowkey查询字段与rowkey的索引映射;查询时,根据所述索引映射关系,在SolrCloud中查询到查询字段对应的rowkey;使用所述rowkey在HBase中进行查找,并将查询结果分页显示。
-
公开(公告)号:CN104102702A
公开(公告)日:2014-10-15
申请号:CN201410321901.0
申请日:2014-07-07
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06F17/30
CPC classification number: G06F17/30289
Abstract: 本发明公开了一种实现软硬件结合的面向应用的大数据系统及方法,包括:硬件层、基础平台层、平台增强层;其中,硬件层,用于根据应用场景以及系统需求对硬件进行定制,并对基础平台层提供硬件支撑;基础平台层,用于根据大数据平台搭配能力以及应用场景的策略,选择一个或者几个大数据平台;平台增强层,用于根据基础平台层选择的大数据平台提供相应的大数据平台工具;其中,应用场景为用户应用需求或用户应用场景。本申请的技术方案屏蔽了平台多样性对用户带来的选择和搭配的难度,并且充分利用了软硬件结合的优势以及结合大数据平台工具提高易用性,极大地提高了行业大数据应用的开发质量和效率。
-
公开(公告)号:CN104021194A
公开(公告)日:2014-09-03
申请号:CN201410265820.3
申请日:2014-06-13
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06F17/30
CPC classification number: G06F17/30943 , G06F3/067
Abstract: 本发明公开了一种面向行业大数据多样性应用的混合型处理系统及方法,该系统包括:分布式数据采集子系统,用于从外部系统采集数据;存储和并行计算子系统,用于对所采集的数据进行存储和计算;一体化资源和系统管理平台,用于对所存储和计算的数据进行管理;其中,存储和并行计算子系统,包括大数据存储子系统和大数据处理子系统;其中,大数据处理子系统,包括内存计算引擎,其中,内存计算引擎,用于在无共享集群中提供分布式内存抽象,并对采集的数据进行并行流水化和线程轻量级处理。本发明能够满足行业大数据多样性业务应用需求,通过内存计算引擎加速能够将大数据处理性能提高10倍以上,通过一体化管理平台能够保障系统的易用性、可靠性及可扩展性。
-
公开(公告)号:CN104462236A
公开(公告)日:2015-03-25
申请号:CN201410648015.9
申请日:2014-11-14
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06F17/30
CPC classification number: G06F17/30979
Abstract: 提出一种基于大数据的伴随车辆识别方法和装置,基于用户输入的目标车辆的车牌号、查询开始时间和结束时间、以及跟车间隔,确定在所述开始时间和结束时间之间所述目标车辆所经过的每一卡口信息和对应的时间点,进而分析并识别所述目标车辆在所述开始时间至结束时间之间经过上述每一卡口时的伴随车辆。所述方法和装置分析占用时间短、识别结果准确,极大地提高了工作效率。
-
公开(公告)号:CN104036039A
公开(公告)日:2014-09-10
申请号:CN201410307198.8
申请日:2014-06-30
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06F17/30
CPC classification number: G06F17/30445
Abstract: 本发明公开了一种数据的并行处理方法,包括:一个或多个Map节点读取账户日志数据的分片数据,从分片数据中选出状态持续时间满足查询日期要求的候选数据记录,生成所选出的候选数据记录的第一输出参数和第二输出参数;第一输出参数至少包括账户ID,第二输出参数至少包括:状态开始日、状态结束日和状态值;一个或多个Reduce节点读取Map节点处理完的不同候选数据记录,根据候选数据记录的第一输出参数和第二输出参数分别生成各账户在查询日期范围内的完整历史状态记录;第一输出参数中账户ID相同的候选数据记录由同一个Reduce节点读取。本发明能提高大规模日志数据的处理效率。本发明还公开了一种数据的并行处理系统。
-
公开(公告)号:CN103970881A
公开(公告)日:2014-08-06
申请号:CN201410208886.9
申请日:2014-05-16
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06F17/30
CPC classification number: H04L67/06
Abstract: 本发明公开了一种实现文件上传的方法及装置,包括:获取分布式文件系统(HDFS)预定数量的数据节点;检测获取的预定数量的数据节点的连通性,得到所有连通的数据节点及连通的数据节点的数量;设置文件服务器上传的每个文件相应的HDFS文件上传命令,并统计HDFS文件上传命令的命令数;根据统计HDFS文件上传命令的命令数及连通的数据节点的数量,进行文件上传。本发明获取预定数量的HDFS的数据节点,通过检测HDFS中的数据节点的连通性后,将文件服务器上传的每个文件相应的HDFS文件上传命令均分给连通的数据节点,实现文件上传,提高文件上传的效率,降低文件上传的时长消耗。
-
公开(公告)号:CN104008153B
公开(公告)日:2017-09-26
申请号:CN201410217394.6
申请日:2014-05-21
Applicant: 浪潮(北京)电子信息产业有限公司
Abstract: 本发明公开了一种面向大数据的数据处理方法和装置,该方法包括:获取处理环境数据及负载场景数据;选择处理环境数据及负载场景数据对应的压缩方式;根据所选择的压缩方式对数据进行处理;处理环境数据包括网络传输的性能指标和磁盘的性能指标;负载场景数据包括读操作比例和写操作比例,读操作比例与写操作比例相加为1。本发明能够指导在不同运行环境、不同负载场景下的压缩方式的选择,优化大数据处理性能。
-
公开(公告)号:CN104361091A
公开(公告)日:2015-02-18
申请号:CN201410658038.8
申请日:2014-11-18
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06F17/30
CPC classification number: G06F17/30557
Abstract: 提出一种大数据系统,所述系统包括大数据基础平台、共享资源库、可视化编辑与展示子系统、以及流程调度子系统。所述系统综合现有各种大数据处理系统,基于用户编辑生成的数据处理流程调度程序资源和数据资源提交特定的大数据处理系统执行数据处理,极大降低了大数据系统的使用门槛,并且使组织内部大数据相关资源能方便共享,数据处理流程可复用可继承。
-
公开(公告)号:CN104102701A
公开(公告)日:2014-10-15
申请号:CN201410321111.2
申请日:2014-07-07
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06F17/30
CPC classification number: G06F17/30309 , G06F17/30548
Abstract: 本发明提出一种基于hive的历史数据存档与查询方法,首先建立hive表,然后使用ETL工具导出源数据并验证,通过验证后将源数据导入hive表,以及基于Thrift接口从hive表中查询历史数据。本发明提出的所述方法能够向其它软件提供接口,并完成定制化历史数据导入和数据查询的功能。
-
公开(公告)号:CN104050291B
公开(公告)日:2017-11-10
申请号:CN201410306448.6
申请日:2014-06-30
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种账户余额数据的并行处理方法,该方法包括:一个或多个执行第一任务的Map节点读取账户余额明细数据的不同分片数据,生成所读取的分片数据中每一条余额记录的第一输出参数和第二输出参数;其中,所述第一输出参数至少包括账户ID,所述第二输出参数设定为账户状态信息,所述账户状态信息至少包括:余额值、交易日期和当天交易序号;一个或多个执行第一任务的Reduce节点读取所述执行第一任务的Map节点处理完毕的不同余额记录,根据所述余额记录的第一输出参数和第二输出参数分别生成各账户的日均余额值记录;其中,第一输出参数相同的余额记录由同一个Reduce节点读取。本发明能够快速获取大数据量下的帐户日均余额的统计结果。本发明还公开了一种账户余额数据的并行处理系统。
-
-
-
-
-
-
-
-
-