-
公开(公告)号:CN116910099B
公开(公告)日:2023-11-17
申请号:CN202311139421.8
申请日:2023-09-06
Applicant: 天津神舟通用数据技术有限公司
IPC: G06F16/2455 , G06F16/22 , G06F16/2453 , G06F16/2458
Abstract: 本申请公开了一种数据处理方法、装置、设备及介质,数据处理方法包括:获取各第一数据单元和各第二数据单元,其中,各第一数据单元和各第二数据单元分别由第一数据集和第二数据集中的目标数据得到;对各第一数据单元和各第二数据单元执行条件过滤操作,根据第一关联条件对经条件过滤操作后剩余的各第一数据单元和各第二数据单元进行关联过滤操作;对经关联过滤操作后剩余的各第一数据单元执行重组操作,得到各第一数据单元集;根据第一数据单元集对经关联过滤操作后剩余的各第二数据单元执行重组操作,得到各第二数据单元集;其中,各第一数据单元集无交集;对具有映射关系的第一数据单元集和第二数据单元集执行数据处理操作,得到数据处理结果。
-
公开(公告)号:CN102981857A
公开(公告)日:2013-03-20
申请号:CN201210514328.6
申请日:2012-12-04
Applicant: 天津神舟通用数据技术有限公司
Abstract: 本发明涉及一种数据库集群的并行压缩海量数据装载方法,其主要技术特点是:包括步骤1:建立包括数据装载工具、驱动程序和数据库集群的并行压缩海量数据装载的组件架构;步骤2、客户端通过数据装载工具和驱动程序向数据库集群发送数据装载命令,获取各个数据库节点的连接信息后,连接各个数据库并且发送需要装载的数据;数据库集群服务器给客户端提供集群各个数据库节点的连接信息以及各个表的相关信息;数据库节点接收客户端发送过来的数据并存储下来。本发明使用海量数据通信协议以及并行优化处理和压缩优化处理方法,充分利用服务器的多CPU和网络资源并融合在海量数据装载过程中,提升了数据库集群的搭建速度。
-
公开(公告)号:CN115309550A
公开(公告)日:2022-11-08
申请号:CN202210930830.9
申请日:2022-08-04
Applicant: 天津神舟通用数据技术有限公司
Abstract: 本发明涉及一种MPP并行数据库实例级副本均衡方法,其技术特点是:存储IO的均衡策略为每个WAL日志配置单独存储硬盘,为业务数据配置一个共享的大容量存储硬盘;物理内存的均衡策略采用动态的数据页面缓冲区分配方式;计算资源的均衡策略采用自适应工作方式;回切原主实例策略包括平滑模式rebalance和速度模式rebalance以满足不同的场景需求。本发明充分考虑MPP并行数据库中并行计算、批量装载数据以及一次写入多次查询的特点,分别从存储IO、物理内存、计算资源和回切原主实例这四个方面进行实例级副本的均衡,最终实现了在不妥协从实例的冗余能力的基础上最大化主实例的计算服务能力。
-
公开(公告)号:CN102033938B
公开(公告)日:2012-06-06
申请号:CN201010597139.0
申请日:2010-12-10
Applicant: 天津神舟通用数据技术有限公司
IPC: G06F17/30
Abstract: 本发明方法是基用一种二级映射的方法来实现满足负载均衡的动态扩展技术。即首先在第一维对集群的数据按照hash方法进行负载的均衡分布,这是第一级映射。在第一维的基础上采用一个M:N的映射表来进行第二级的映射,从而在第一维实现数据的分布负载均衡,在第二维实现集群的动态扩展。本发明使用了二级映射方法,既保留了集群中常用的hash分发方法的数据分布负载均衡特点,又支持了动态扩展的需要。同时利用了元数据库的事务特性保证了对二级映射表更新时的读写隔离性,保证了扩展的动态在线。和静态扩展技术动辄需要停机几分钟相比,本发明不仅不需停止应用业务,而且操作简单,每扩展一个节点的时间在秒级。
-
-
-