-
公开(公告)号:CN104484468A
公开(公告)日:2015-04-01
申请号:CN201410847868.5
申请日:2014-12-31
Applicant: 天津南大通用数据技术股份有限公司
IPC: G06F17/30
CPC classification number: G06F17/30566
Abstract: 本发明提供一种基于Dblink和透明网关的数据库系统的构建使用方法,包括以下步骤:S1.建立透明网关系统,并对其进行配置;S2.通过本地系统对于需要访问的异构数据库或者集群创建Dblink;S3.借助透明网关,使用Dblink对需要访问的异构数据库或者集群的数据进行访问;这种设计提供一种数据连接方式,使GBase8a集群访问其它数据库或者集群组成的异构系统,获取其中的多种数据,并且通过透明网关对语句进行方言转换,结构简洁,操作简单。
-
公开(公告)号:CN104410698A
公开(公告)日:2015-03-11
申请号:CN201410727702.X
申请日:2014-12-03
Applicant: 天津南大通用数据技术股份有限公司
CPC classification number: H04L67/10 , H04L41/0668
Abstract: 本发明提供一种share nothing集群下的发起节点异常处理方法及装置,所述方法包括:集群中发起节点接收到数据请求任务后,先将其他节点设置为此数据请求任务的接管节点,接管节点向集群管理软件提交注册信息完成信息记录,发起节点继续执行任务;若执行过程无异常,发起节点完成任务并将集群管理软件设置为任务结束并清理资源;若执行过程出现异常,集群管理软件选择一个接管节点继续执行任务,接管节点完成任务之后将集群管理软件设置为任务结束并清理资源;如果任务已不可继续执行,则进行任务的异常处理,进行恢复。本发明能够解决数据库系统在执行任务中并行任务管理软件发生异常时造成集群数据不一致问题,提高了系统的稳定性。
-
公开(公告)号:CN104408151A
公开(公告)日:2015-03-11
申请号:CN201410727737.3
申请日:2014-12-03
Applicant: 天津南大通用数据技术股份有限公司
IPC: G06F17/30
CPC classification number: G06F17/30342
Abstract: 本发明旨在提供一种在超大规模列存数据库中有效提升函数查询过滤数据的方法。包括,将列存数据按块存储,对每个数据块(Data Cell)建立基于统计信息的简单索引及基于函数的函数索引。当使用函数进行查询时,基于统计信息的简单索引无法有效过滤数据,而基于函数的函数索引则能有效过滤,提升数据库的整体性能。本发明所取得的有益效果是在超大规模数据量的列存数据库上提高了数据过滤的效率,并可根据用户实际场景灵活扩展。同时不需要用户手动干预,函数索引能自动维护。
-
公开(公告)号:CN104408150A
公开(公告)日:2015-03-11
申请号:CN201410727556.0
申请日:2014-12-03
Applicant: 天津南大通用数据技术股份有限公司
IPC: G06F17/30
CPC classification number: G06F17/30303 , G06F17/30563
Abstract: 传统的ETL方式是指数据抽取(Extract)、转换(Transform)、装载(Load)的过程。用户需要从数据源抽取出所需的数据,再手动进行经过数据清洗及转换,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。本发明旨在提供一种在新型的数据抽取加载方式,该方式将数据抽取,数据清洗,数据转换组合在一起,使数据在抽取时就能同时进行清洗和转换,同时它又支持多种市面上常见的数据格式,从而不但使用户的操作更为简便,也提高了数据抽取及转换的速度及效率。
-
公开(公告)号:CN104376119A
公开(公告)日:2015-02-25
申请号:CN201410729620.9
申请日:2014-12-03
Applicant: 天津南大通用数据技术股份有限公司
IPC: G06F17/30
CPC classification number: G06F17/30315 , G06F17/30333
Abstract: 本发明旨在提供一种在超大规模列存数据库中快速定位及访问数据的方法。包括,将列存数据根据特征进行数据块划分,对全部数据块建立多阶特征索引。本发明中数据的特征划分使同类数据相聚合,降低数据块内部离散度,访问更加精准。而高阶索引可以加快数据过滤速度,并有效控制对低阶索引和数据的访问。以上两种方式将大量减少内存与I/O设备间的数据交换,提高数据库运行效率。
-
公开(公告)号:CN106372163B
公开(公告)日:2020-12-04
申请号:CN201610777842.7
申请日:2016-08-31
Applicant: 天津南大通用数据技术股份有限公司
Abstract: 本发明提供了一种适用于分布式数据库的数据分发方法及装置,其中,所述方法包括:存在数据分发任务时,对所述数据按照最小存储单位进行拆分;计算拆分的最小存储单位数据的分布目标,并根据所述分布目标向节点分发数据。通过对所述数据按照最小存储单位进行拆分;计算拆分的数据的分布目标,向所述分布目标分发数据。由于将物化继续推迟,保持整个数据计算过程尽可能的不物化或少物化数据,降低磁盘I/O。直到最后按照分布规则拆分时才将数据进行物化。减少了预算工作量和系统负担。
-
公开(公告)号:CN106407309B
公开(公告)日:2020-05-29
申请号:CN201610777843.1
申请日:2016-08-31
Applicant: 天津南大通用数据技术股份有限公司
Abstract: 本发明涉及一种支持多种数据源的集群数据库数据加载工具及方法。其目的是为了提供一种认证快捷、认证方式多样的集群数据库数据加载工具及方。本发明包括加载工具使用接口、加载任务管理模块、加载任务执行模块、读数据模块、数据源访问模块、写数据模块和数据库访问模块。加载工具使用接口用于启动加载任务,并将各个任务的参数传递给加载任务管理模块;加载任务管理模块用于保存、维护和调度所有接收到的加载任务;加载任务执行模块用于负责具体加载任务的执行;读数据模块用于提供统一的读取数据接口;数据源访问模块用于从具体的数据源上读取数据;写数据模块用于提供统一的写数据接口;数据库访问模块用于将接收到的数据加载进集群数据库。
-
公开(公告)号:CN109960573A
公开(公告)日:2019-07-02
申请号:CN201811643211.1
申请日:2018-12-29
Applicant: 天津南大通用数据技术股份有限公司
Abstract: 本发明提出一种基于智能感知的跨域计算任务调度方法及系统,包括:步骤1、基于标签数据训练决策树模型;步骤2、基于相对时间复杂度估算计算任务的执行时间;步骤3、基于资源历史记录和ARIMA算法预测各域的资源变化趋势指标;步骤4、使用资源状态接口获取各个域的资源实时状态指标;步骤5、基于可用带宽估算数据迁移到各个域的迁移时间;步骤6、基于决策树模型和综合指标决策任务最优执行域。本发明创造性地将趋势预测算法和决策树算法综合应用于跨域计算任务调度场景,避免了任务资源抢占现象,解决了调度决策正确率低的问题;通过流式机器学习技术,克服了趋势预测算法和决策树算法的性能问题,大幅缩短了跨域计算任务调度整体时间。
-
公开(公告)号:CN105512315B
公开(公告)日:2019-04-30
申请号:CN201510932891.9
申请日:2015-12-12
Applicant: 天津南大通用数据技术股份有限公司
IPC: G06F16/27
Abstract: 本发明涉及分布式数据库数据存储领域,尤其涉及一种分布式数据库SQL执行中INNER JOIN的智能评估方法。该方法采用贪心方法、动态规划方法和遗传算法3种评估方法相结合的方式选取INNER JOIN的较优执行顺序,尽可能减少INNER JOIN之后的数据量,保证INNER JOIN的高效率执行。本发明可以由用户指定任一种评估方法,提高系统的灵活性和可扩展性。
-
-
-
-
-
-
-
-
-