-
-
公开(公告)号:CN110232085A
公开(公告)日:2019-09-13
申请号:CN201910359658.4
申请日:2019-04-30
Applicant: 中国科学院计算机网络信息中心
IPC: G06F16/25 , G06F16/2455
Abstract: 本发明涉及一种大数据ETL任务的编排方法与系统。该方法包括:1)对用户编排的ETL任务进行数据处理组件配置和数据流向配置;2)根据数据处理组件和数据流向,将用户编排的ETL任务生成模型描述语言;3)将模型描述语言解析成ETL任务的有向无环图,所述有向无环图中的节点为数据处理组件,边为数据流向;4)根据ETL任务的有向无环图,通过执行引擎对任务进行执行。在ETL任务执行过程中可对ETL任务执行状况进行监控并对日志进行解析。该系统包括可视化引擎、Rest API接口、执行引擎、监控模块、日志模块。本发明能够可视化配置大数据ETL流程,监控ETL运行状况,提供丰富的数据处理组件,组件可扩展。
-
公开(公告)号:CN106250534B
公开(公告)日:2019-07-16
申请号:CN201610640243.0
申请日:2016-08-05
Applicant: 中国科学院计算机网络信息中心
IPC: G06F16/26
Abstract: 本发明涉及一种基于主题流的时空延迟相关性可视化方法。该方法以主题流这种基于独立空间的可视化方法为基础,通过对主题流增加相关性大小、不同时序数据延迟的时间长度、以及空间距离的支持,以达到对具有空间关系的多时序数据的延迟相关性的可视化及分析;在此基础上,通过基于距离的分组,以及增加对二维空间的支持,给出了能够进一步增加空间分析能力的可视化方法。本发明能够通过多主题流的方式实现对具有空间关系的多时序数据的可视化。
-
公开(公告)号:CN109558494A
公开(公告)日:2019-04-02
申请号:CN201811267181.9
申请日:2018-10-29
Applicant: 中国科学院计算机网络信息中心
Abstract: 本发明公开了一种基于异质网络嵌入的学者名字消歧方法,其步骤为:1)设定多个需要消歧的作者,收集所有与设定需要消歧的作者相关的论文,然后利用所收集论文的作者和论文的语义信息生成论文关系异质网络;2)根据论文关系异质网络,通过基于元路径随机游走策略生成包含论文节点邻居节点文本信息的路径,并将这些路径保存为训练语料库;3)利用Skip-gram模型对训练语料库进行训练,生成每一论文对应的论文表征向量;4)对于步骤1)中一设定需要消歧的作者,从得到的论文表征向量中获取该作者的论文对应的论文表征向量;5)对步骤4)得到的论文表征向量进行聚类,得到若干簇,实现对该作者名字的消歧。
-
公开(公告)号:CN107749073A
公开(公告)日:2018-03-02
申请号:CN201610753059.7
申请日:2016-08-29
Applicant: 中国科学院计算机网络信息中心
CPC classification number: G06T11/203 , G06F17/18 , G09B29/00
Abstract: 本发明涉及一种支持时序特征探查的统计地图绘制方法,该方法根据时序统计数据的地理区域信息以及时序特征,将时序统计数据绘制到地理区域内部,得到统计地图。进一步还包括将统计指标数据绘制到地理区域边缘内侧的步骤:首先根据时序统计数据,计算需要进行分析和呈现的统计指标;然后根据时序统计数据的地理区域信息,将统计指标数据绘制到地理区域边缘内侧。本发明能够在最大限度的利用空间的情况下,对统计数据的整体特征以及时序特征进行探查,能够实现对时序统计数据整体和时序特征的可视化。
-
公开(公告)号:CN106997692A
公开(公告)日:2017-08-01
申请号:CN201710383979.9
申请日:2017-05-26
Applicant: 广州数字方舟信息技术股份有限公司 , 中国科学院计算机网络信息中心
Abstract: 本发明提供一种混合型航标报警智能检测方法,其步骤包括:1)根据历史定时数据和历史报警数据发现相似站点,得到相似站点划分及相似站点数据;2)根据上述相似站点划分及相似站点数据、历史报警数据及该报警时刻向前一段时间的历史定时数据进行报警模型训练,生成二次报警的模型;3)将实时报警数据及该报警时刻向前一段时间的历史定时数据输入所述二次报警的模型,进行报警结果判断;4)根据上述报警结果及人工反馈的报警结果,对步骤2)中所述报警模型进行修正。该方法能够在充分利用领域知识的前提下,结合数据挖掘方法和人工反馈,实现对航标异常进行报警。且该方法能够有效提高报警判断的准确率。
-
公开(公告)号:CN106372104A
公开(公告)日:2017-02-01
申请号:CN201610694753.6
申请日:2016-08-19
Applicant: 中国科学院计算机网络信息中心
IPC: G06F17/30
Abstract: 本发明涉及一种时空延迟相关性可视化方法。该方法以基于矩形的可视化方法为基础,通过连续的不同颜色映射的矩形块,对各个不同延迟时间的相关性进行表示;通过层次化的划分,以及矩形带(每一个站点对应的多个矩形块)的距离映射,对不同空间关系的站点的相关性进行表示。通过本发明,能够实现对多个具有空间关系的时序数据的延迟相关性进行可视化,帮助分析师发现相关性背后隐含的因果关系。
-
公开(公告)号:CN104580447A
公开(公告)日:2015-04-29
申请号:CN201410848528.4
申请日:2014-12-29
Applicant: 中国科学院计算机网络信息中心
IPC: H04L29/08
CPC classification number: H04L41/50 , H04L41/5035
Abstract: 本发明涉及一种基于访问热度的时空数据服务调度方法。该方法是:1)采集服务系统中各存储介质的参数,以及服务系统中各计算节点的参数;2)根据采集的数据编制数据服务系统的网络拓扑图;3)根据所述网络拓扑图,把时空数据进行时空分片,采集并记录每个时空区块的访问数据访问的热度;4)根据访问热度调整数据的分布位置,并对计算节点进行调度。所述访问热度是指不同的时空区间内用户访问某些服务的频度。本发明能够将数据从存储介质到计算节点的多路径进行建模,系统根据数据的访问热度把数据分布在不同的存储介质,计算节点通过不同的网络途径获取所需的数据,从而降低数据服务系统的响应时间,提高数据服务系统的服务质量。
-
公开(公告)号:CN119598006A
公开(公告)日:2025-03-11
申请号:CN202411534489.0
申请日:2024-10-30
Applicant: 中国科学院计算机网络信息中心
IPC: G06F16/9535 , G06F16/901 , G06F40/30 , G06N5/022 , G06N3/042 , G06N3/0464 , G06N3/045 , G06N3/0455 , G06N3/08 , G06F16/36 , G16C60/00
Abstract: 本发明涉及生物信息学和人工智能技术领域,特别涉及一种基于知识图谱的微生物合成纳米材料推荐方法。获取微生物信息和纳米材料信息;通过所述微生物信息和所述纳米材料信息构建知识图谱;其中,所述知识图谱的节点由微生物、纳米材料、合成方法和元素组成;基于所述知识图谱得到结构特征向量和语义特征向量;拼接所述结构特征向量和所述语义特征向量,得到所述各节点的表示向量;基于所述表示向量对所述各节点进行打分,根据所述打分的结果判断微生物和纳米材料的关系。本发明可以从大规模的知识图谱中挖掘微生物与潜在纳米材料之间的隐性关联。
-
公开(公告)号:CN113962131B
公开(公告)日:2024-04-30
申请号:CN202111304959.0
申请日:2021-11-05
Applicant: 中国科学院计算机网络信息中心
IPC: G06F30/23 , G06F30/28 , G06F113/08 , G06F113/14 , G06F119/08 , G06F119/14
Abstract: 本发明公开一种高效模拟大型天然气管网流动传热的方法,涉及天然气管网数据模拟领域,本方法在使用SIMPLE算法来求解控制方程的基础上,结合离散矩阵的稀疏性与管网结构特点,利用循环三对角矩阵求解算法与开源向量库,构建了管网中管道节点分开模拟的方法,从而加快了计算速度。本方法结合离散矩阵的稀疏性与管网结构特点,利用循环三对角矩阵求解算法与开源向量库,构建了管网中管道节点分开模拟的方法,从而加快了计算速度。
-
-
-
-
-
-
-
-
-