-
公开(公告)号:CN103198159A
公开(公告)日:2013-07-10
申请号:CN201310153332.9
申请日:2013-04-27
Applicant: 国家计算机网络与信息安全管理中心 , 天津神舟通用数据技术有限公司
Abstract: 本发明涉及一种基于事务重做的异构集群多副本一致性维护方法,其特点是:包括查询执行阶段:集群事务管理模块跟踪活动事务表,录制事务操作;集群为主数据节点生成事务重做日志;集群将事务重做日志文件发送给所有副本数据节点并管理节点状态;副本维护阶段:副本数据节点接收来自于主数据节点的事务重做日志文件;故障恢复阶段:数据库管理员将查找出故障节点对应的存档日志,将所有副本数据节点的数据恢复到同主数据节点一致的状态。本发明解决了现有技术存在代价高、性能差的问题,弥补了二进制日志传输方式无法支持异构数据库的不足,实现了多副本之间的快速一致性维护,保证无共享集群的高可用性,同时能够支持集群数据库节点的异构化。
-
公开(公告)号:CN105426427A
公开(公告)日:2016-03-23
申请号:CN201510740873.0
申请日:2015-11-04
Applicant: 国家计算机网络与信息安全管理中心 , 天津神舟通用数据技术有限公司
CPC classification number: G06F16/273 , G06F3/0689 , G06F11/1469 , G06F16/211 , G06F16/2365
Abstract: 本发明涉及一种基于RAID 0存储的MPP数据库集群副本实现方法,其技术特点是包括副本分布算法模块、副本状态维护模块、访问重定向模块、数据一致性维护模块并通过以下步骤实现:进行数据库存储部署;计算副本存储位置;创建副本存储实体;进行副本元信息维护;进行副本数据访问;使用数据一致性维护模块进行副本数据一致性维护。本发明设计合理,其为MPP数据库集群引入系统层面的数据冗余,通过牺牲一定的存储空间来换取数据安全,提高了系统可用性;当出现硬件故障或副本数据被破坏(失效)时,系统自动将对该数据分片的访问导向另一个可用副本,实现对外不间断服务,并且解决单一数据并发访问“过热”问题,提高系统的吞吐性能。
-
公开(公告)号:CN105302638A
公开(公告)日:2016-02-03
申请号:CN201510740736.7
申请日:2015-11-04
Applicant: 国家计算机网络与信息安全管理中心 , 天津神舟通用数据技术有限公司
IPC: G06F9/48
Abstract: 本发明涉及一种基于系统负载的MPP集群任务调度方法,其技术特点是包括设置在MPP集群主控节点上的多功能任务调度器和设置在各个节点上的系统负载计算模块,并按以下步骤实现:各个节点上的系统负载计算模块实时监控节点的负载变化并反馈至MPP集群主控节点上;MPP集群主控节点上的多功能任务调度器根据任务的分布信息以及对应节点的负载情况完成任务的排队和调度。本发明在MPP集群主控节点上设置多功能任务调度器并实时收集群内所有计算节点的系统负载信息,MPP集群主控节点依据任务的分布信息以及对应节点的负载情况,完成对任务的排队和调度,通过对系统负载的实时监控,实现动态并发控制,可以有效提高资源的利用率,使系统达到最佳吞吐性能。
-
公开(公告)号:CN105302638B
公开(公告)日:2018-11-20
申请号:CN201510740736.7
申请日:2015-11-04
Applicant: 国家计算机网络与信息安全管理中心 , 天津神舟通用数据技术有限公司
IPC: G06F9/48
Abstract: 本发明涉及一种基于系统负载的MPP集群任务调度方法,其技术特点是包括设置在MPP集群主控节点上的多功能任务调度器和设置在各个节点上的系统负载计算模块,并按以下步骤实现:各个节点上的系统负载计算模块实时监控节点的负载变化并反馈至MPP集群主控节点上;MPP集群主控节点上的多功能任务调度器根据任务的分布信息以及对应节点的负载情况完成任务的排队和调度。本发明在MPP集群主控节点上设置多功能任务调度器并实时收集集群内所有计算节点的系统负载信息,MPP集群主控节点依据任务的分布信息以及对应节点的负载情况,完成对任务的排队和调度,通过对系统负载的实时监控,实现动态并发控制,可以有效提高资源的利用率,使系统达到最佳吞吐性能。
-
公开(公告)号:CN105335479A
公开(公告)日:2016-02-17
申请号:CN201510657159.5
申请日:2015-10-12
Applicant: 国家计算机网络与信息安全管理中心 , 天津神舟通用数据技术有限公司
IPC: G06F17/30
CPC classification number: G06F17/30404 , G06F17/30445 , G06F17/30592 , G06F17/30637
Abstract: 本发明涉及一种基于SQL的文本数据统计实现方法,其技术特点是:对输入SQL语法进行解析;在结构化数据仓库中建立和子查询投影结构一致的临时表;识别全文索引引擎数据分布规则;将基于SQL的简单子查询翻译为全文索引引擎语法,并在全文索引引擎中执行;获取全文索引查询结果并将结果导入到结构化数据仓库引擎临时表中;完成查询结果导入过程,向数据仓库下发重写后的基于临时表SQL查询语句,并向客户端返回查询结果。本发明结合全文索引引擎和结构化数据仓库引擎的特点,实现对海量文本数据的基于通用SQL语言的统计分析方法,解决了传统方法统计功能薄弱和结构化数据仓库无法支持高效文本检索的问题,大大提高了文本数据统计分析的易用性。
-
公开(公告)号:CN103198159B
公开(公告)日:2016-01-06
申请号:CN201310153332.9
申请日:2013-04-27
Applicant: 国家计算机网络与信息安全管理中心 , 天津神舟通用数据技术有限公司
Abstract: 本发明涉及一种基于事务重做的异构集群多副本一致性维护方法,其特点是:包括查询执行阶段:集群事务管理模块跟踪活动事务表,录制事务操作;集群为主数据节点生成事务重做日志;集群将事务重做日志文件发送给所有副本数据节点并管理节点状态;副本维护阶段:副本数据节点接收来自于主数据节点的事务重做日志文件;故障恢复阶段:数据库管理员将查找出故障节点对应的存档日志,将所有副本数据节点的数据恢复到同主数据节点一致的状态。本发明解决了现有技术存在代价高、性能差的问题,弥补了二进制日志传输方式无法支持异构数据库的不足,实现了多副本之间的快速一致性维护,保证无共享集群的高可用性,同时能够支持集群数据库节点的异构化。
-
公开(公告)号:CN105303252A
公开(公告)日:2016-02-03
申请号:CN201510657269.1
申请日:2015-10-12
Applicant: 国家计算机网络与信息安全管理中心 , 天津神舟通用数据技术有限公司
Abstract: 本发明涉及一种基于遗传算法的多阶段神经网络模型训练方法,其技术特点是包括以下步骤:对数据进行预处理以消除字段的量纲影响;根据输入层、隐含层、输出层节点数,构建多输入层网络结构;采用遗传算法训练初始权重和阈值;利用迭代算法更新权重;根据迭代次数及模型误差判断是否满足模型终止条件:如果满足,则模型结束,否则重新更新权重。本发明针对过程控制中参数分阶段影响输出的问题,构建一个多阶段神经网络结构,根据遗传算法具有全局搜索的特点,采用其为网络结构选择一组较合理的初始权重,从而尽可能地防止网络训练进行局部极小点,解决了只有一个输入层的神经网络结构无法解决工程控制中具有前后顺序的参数影响产品加工的问题。
-
公开(公告)号:CN108536808B
公开(公告)日:2022-04-29
申请号:CN201810296682.3
申请日:2018-04-04
Applicant: 国家计算机网络与信息安全管理中心 , 天津神舟通用数据技术有限公司
Abstract: 本发明公开了一种基于Spark计算框架的数据获取方法和装置。该方法包括:在接收到表对象访问请求之后,获取Spark的计算资源信息以及MPP集群中待访问的数据表的数据分布信息;根据计算资源信息和数据分布信息,生成多个Partition;其中,每个Partition对应数据表中的部分数据;通过生成的多个Partition,从MPP集群中获取数据表。本发明充分利用MPP集群的数据存储特性,通过多个Partition,直接从MPP的存储节点快速获取数据集。进一步地,在计算资源充足的情况下,可以对存储节点的数据表进行进一步的拆分,以达到提高并行度,提升数据导入性能的目的。可以根据MPP集群的数据分布情况,优先从本地存储中获取数据,减少数据传输开销、节约网络带宽、减少网络延迟、提高计算性能。
-
公开(公告)号:CN105335479B
公开(公告)日:2018-11-23
申请号:CN201510657159.5
申请日:2015-10-12
Applicant: 国家计算机网络与信息安全管理中心 , 天津神舟通用数据技术有限公司
IPC: G06F17/30
Abstract: 本发明涉及一种基于SQL的文本数据统计实现方法,其技术特点是:对输入SQL语法进行解析;在结构化数据仓库中建立和子查询投影结构一致的临时表;识别全文索引引擎数据分布规则;将基于SQL的简单子查询翻译为全文索引引擎语法,并在全文索引引擎中执行;获取全文索引查询结果并将结果导入到结构化数据仓库引擎临时表中;完成查询结果导入过程,向数据仓库下发重写后的基于临时表SQL查询语句,并向客户端返回查询结果。本发明结合全文索引引擎和结构化数据仓库引擎的特点,实现对海量文本数据的基于通用SQL语言的统计分析方法,解决了传统方法统计功能薄弱和结构化数据仓库无法支持高效文本检索的问题,大大提高了文本数据统计分析的易用性。
-
公开(公告)号:CN108536808A
公开(公告)日:2018-09-14
申请号:CN201810296682.3
申请日:2018-04-04
Applicant: 国家计算机网络与信息安全管理中心 , 天津神舟通用数据技术有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种基于Spark计算框架的数据获取方法和装置。该方法包括:在接收到表对象访问请求之后,获取Spark的计算资源信息以及MPP集群中待访问的数据表的数据分布信息;根据计算资源信息和数据分布信息,生成多个Partition;其中,每个Partition对应数据表中的部分数据;通过生成的多个Partition,从MPP集群中获取数据表。本发明充分利用MPP集群的数据存储特性,通过多个Partition,直接从MPP的存储节点快速获取数据集。进一步地,在计算资源充足的情况下,可以对存储节点的数据表进行进一步的拆分,以达到提高并行度,提升数据导入性能的目的。可以根据MPP集群的数据分布情况,优先从本地存储中获取数据,减少数据传输开销、节约网络带宽、减少网络延迟、提高计算性能。
-
-
-
-
-
-
-
-
-