基于系统负载的MPP集群任务调度方法

    公开(公告)号:CN105302638B

    公开(公告)日:2018-11-20

    申请号:CN201510740736.7

    申请日:2015-11-04

    Abstract: 本发明涉及一种基于系统负载的MPP集群任务调度方法,其技术特点是包括设置在MPP集群主控节点上的多功能任务调度器和设置在各个节点上的系统负载计算模块,并按以下步骤实现:各个节点上的系统负载计算模块实时监控节点的负载变化并反馈至MPP集群主控节点上;MPP集群主控节点上的多功能任务调度器根据任务的分布信息以及对应节点的负载情况完成任务的排队和调度。本发明在MPP集群主控节点上设置多功能任务调度器并实时收集集群内所有计算节点的系统负载信息,MPP集群主控节点依据任务的分布信息以及对应节点的负载情况,完成对任务的排队和调度,通过对系统负载的实时监控,实现动态并发控制,可以有效提高资源的利用率,使系统达到最佳吞吐性能。

    基于系统负载的MPP集群任务调度方法

    公开(公告)号:CN105302638A

    公开(公告)日:2016-02-03

    申请号:CN201510740736.7

    申请日:2015-11-04

    Abstract: 本发明涉及一种基于系统负载的MPP集群任务调度方法,其技术特点是包括设置在MPP集群主控节点上的多功能任务调度器和设置在各个节点上的系统负载计算模块,并按以下步骤实现:各个节点上的系统负载计算模块实时监控节点的负载变化并反馈至MPP集群主控节点上;MPP集群主控节点上的多功能任务调度器根据任务的分布信息以及对应节点的负载情况完成任务的排队和调度。本发明在MPP集群主控节点上设置多功能任务调度器并实时收集群内所有计算节点的系统负载信息,MPP集群主控节点依据任务的分布信息以及对应节点的负载情况,完成对任务的排队和调度,通过对系统负载的实时监控,实现动态并发控制,可以有效提高资源的利用率,使系统达到最佳吞吐性能。

    一种基于SQL的文本数据统计实现方法

    公开(公告)号:CN105335479B

    公开(公告)日:2018-11-23

    申请号:CN201510657159.5

    申请日:2015-10-12

    Abstract: 本发明涉及一种基于SQL的文本数据统计实现方法,其技术特点是:对输入SQL语法进行解析;在结构化数据仓库中建立和子查询投影结构一致的临时表;识别全文索引引擎数据分布规则;将基于SQL的简单子查询翻译为全文索引引擎语法,并在全文索引引擎中执行;获取全文索引查询结果并将结果导入到结构化数据仓库引擎临时表中;完成查询结果导入过程,向数据仓库下发重写后的基于临时表SQL查询语句,并向客户端返回查询结果。本发明结合全文索引引擎和结构化数据仓库引擎的特点,实现对海量文本数据的基于通用SQL语言的统计分析方法,解决了传统方法统计功能薄弱和结构化数据仓库无法支持高效文本检索的问题,大大提高了文本数据统计分析的易用性。

    一种数据处理方法、装置、设备及介质

    公开(公告)号:CN117435629A

    公开(公告)日:2024-01-23

    申请号:CN202311733338.3

    申请日:2023-12-18

    Abstract: 本发明公开一种数据处理方法、装置、设备及介质,包括:将初始数据划分为若干个行组单元,将由各行组单元按列压缩得到的各压缩单元进行存储;行组单元包含初始数据中的多行数据,压缩单元所包含数据通过压缩单元所对应的索引项表示;若压缩单元中的数据需要更新,则将发生更新的各行数据按行存储形式存储到该压缩单元对应的更新数据单元;根据数据查询指令确定待查询的数据列;根据压缩单元对应的索引项确定压缩单元是否可过滤;若存在与压缩单元对应的更新数据单元,根据压缩单元的过滤情况或压缩单元中待查询的数据列是否发生过更新,确定压缩单元对应的更新数据单元是否可过滤;从不可过滤的压缩单元和不可过滤的更新数据单元中查询目标数据。

    一种基于多压缩模式子分区表的存储和查询方法

    公开(公告)号:CN115630065B

    公开(公告)日:2023-08-22

    申请号:CN202211272183.3

    申请日:2022-10-18

    Abstract: 本发明提出一种基于多压缩模式子分区表的存储和查询方法,包括:步骤S1、接收一系列按照预定格式流传输的块数据;步骤S2、基于预定格式进行解析,获取所述块数据中的数据组成;步骤S3、分析数据组成的不同部分,对应的采用不同压缩模式对数据块进行压缩;步骤S4、基于所采用的压缩模式,在第一查找表中匹配对应的分区号段,在压缩数据中单独设置的索引分区类型字段,将所述匹配到的索引分区号段作为附加数据;步骤S5、基于所述的分区号标志,存储到对应的子分区表中,并记录对应数据的索引和压缩模式字段;步骤S6、在数据存储过程中,对不同的子分区表,分配不同大小的连续空间进行存储;步骤S7、用户基于数据压缩模式或数据格式类型,在对应的索引存储表中进行检索。

    一种数据处理方法及相关设备
    10.
    发明公开

    公开(公告)号:CN119828970A

    公开(公告)日:2025-04-15

    申请号:CN202411905660.4

    申请日:2024-12-23

    Abstract: 本申请提供一种数据处理方法及相关设备,涉及数据库应用领域,所述方法包括:在接收到目标数据的写入请求的情况下,为目标数据申请存储空间,存储空间包括至少一个范围,范围包括数据页面和校验页面;将第一范围的校验信息写入第一范围对应的校验页面,第一范围的校验信息为将目标数据写入第一范围对应的数据页面时,计算得到的校验信息,校验信息用于进行冗余校验,第一范围为至少一个范围中的任一范围;将第一范围写入持久化存储。可以利用校验信息检测数据是否损坏,提高了数据存储的可靠性,降低了因静默错误等原因导致的数据损坏风险;同时减少出现的写放大问题、减少配置额外副本占用的存储空间,能够有效地平衡了存储开销和数据可靠性。

Patent Agency Ranking