-
公开(公告)号:CN106294826A
公开(公告)日:2017-01-04
申请号:CN201610681964.6
申请日:2016-08-17
Applicant: 北京北信源软件股份有限公司
IPC: G06F17/30
CPC classification number: G06F16/245 , G06F16/27
Abstract: 本发明提供了一种集群数据实时查询方法及系统,其中,集群数据实时查询方法包括以下步骤:获取客户端的查询请求,所述查询请求携带所述查询数据的地址内容;将所述查询请求发送至Hadoop集群数据平台的Hbase数据库接口并读取查询数据;将所述查询数据写入暂存文件中,所述暂存文件位于查询服务器的缓存中;将所述暂存文件发送至所述客户端。本发明实施例通过缓存的设置减少了对数据库的查询次数以及与客户端数据传输的速度,从而使集群数据的查询时间由分钟级变为秒级,实现了集群数据的实时查询。
-
公开(公告)号:CN107038244A
公开(公告)日:2017-08-11
申请号:CN201710273242.1
申请日:2017-04-24
Applicant: 北京北信源软件股份有限公司
CPC classification number: G06F17/30539 , G06F9/5083 , G06F17/30194 , G06F17/30519 , G06F2216/03 , G06K9/6267
Abstract: 本发明公开了一种数据挖掘方法和装置、一种可读介质和存储控制器,该数据挖掘方法包括:将原始数据存储于分布式文件系统HDFS上,并分配到至少一个数据节点上;将具有M维特征向量的原始数据进行降维处理,形成具有m维特征向量的低维数据,其中M>m;按照预设比例,在每一个数据节点上将低维数据划分为训练数据和测试数据;在每一个数据节点上对训练数据进行训练,获得多层感知器分类模型;利用上述的知器分类模型对测试数据进行预测,确定多层感知器分类模型的预测准确性并实现数据挖掘。该数据挖掘方法能够降低数据挖掘的成本以及提高数据挖掘的效率。
-
公开(公告)号:CN106294826B
公开(公告)日:2019-06-21
申请号:CN201610681964.6
申请日:2016-08-17
Applicant: 北京北信源软件股份有限公司
IPC: G06F16/27 , G06F16/245
Abstract: 本发明提供了一种集群数据实时查询方法及系统,其中,集群数据实时查询方法包括以下步骤:获取客户端的查询请求,所述查询请求携带所述查询数据的地址内容;将所述查询请求发送至Hadoop集群数据平台的Hbase数据库接口并读取查询数据;将所述查询数据写入暂存文件中,所述暂存文件位于查询服务器的缓存中;将所述暂存文件发送至所述客户端。本发明实施例通过缓存的设置减少了对数据库的查询次数以及与客户端数据传输的速度,从而使集群数据的查询时间由分钟级变为秒级,实现了集群数据的实时查询。
-
公开(公告)号:CN106250461A
公开(公告)日:2016-12-21
申请号:CN201610607692.5
申请日:2016-07-28
Applicant: 北京北信源软件股份有限公司
CPC classification number: G06F16/182 , G06F2216/03 , G06K9/624
Abstract: 本发明公开了一种基于Spark框架利用梯度提升决策树进行数据挖掘的算法,该算法步骤如下:(1)原始数据分布式存储于Hadoop平台的分布式文件系统HDFS上并分配成n个数据集;(2)每个数据集降维处理,抽取出最重要的特征向量,将特征维度从M降低到m,m
-
-
-