-
公开(公告)号:CN110232085B
公开(公告)日:2021-09-24
申请号:CN201910359658.4
申请日:2019-04-30
Applicant: 中国科学院计算机网络信息中心
IPC: G06F16/25 , G06F16/2455
Abstract: 本发明涉及一种大数据ETL任务的编排方法与系统。该方法包括:1)对用户编排的ETL任务进行数据处理组件配置和数据流向配置;2)根据数据处理组件和数据流向,将用户编排的ETL任务生成模型描述语言;3)将模型描述语言解析成ETL任务的有向无环图,所述有向无环图中的节点为数据处理组件,边为数据流向;4)根据ETL任务的有向无环图,通过执行引擎对任务进行执行。在ETL任务执行过程中可对ETL任务执行状况进行监控并对日志进行解析。该系统包括可视化引擎、Rest API接口、执行引擎、监控模块、日志模块。本发明能够可视化配置大数据ETL流程,监控ETL运行状况,提供丰富的数据处理组件,组件可扩展。
-
公开(公告)号:CN107749073B
公开(公告)日:2021-05-11
申请号:CN201610753059.7
申请日:2016-08-29
Applicant: 中国科学院计算机网络信息中心
Abstract: 本发明涉及一种支持时序特征探查的统计地图绘制方法,该方法根据时序统计数据的地理区域信息以及时序特征,将时序统计数据绘制到地理区域内部,得到统计地图。进一步还包括将统计指标数据绘制到地理区域边缘内侧的步骤:首先根据时序统计数据,计算需要进行分析和呈现的统计指标;然后根据时序统计数据的地理区域信息,将统计指标数据绘制到地理区域边缘内侧。本发明能够在最大限度的利用空间的情况下,对统计数据的整体特征以及时序特征进行探查,能够实现对时序统计数据整体和时序特征的可视化。
-
公开(公告)号:CN110659768A
公开(公告)日:2020-01-07
申请号:CN201910749170.2
申请日:2019-08-14
Applicant: 中国科学院计算机网络信息中心
Abstract: 本发明提出一种数据出版物学术影响力评价预测方法,包括如下步骤:提取数据论文个体的不同时间段的引用次数和引用格式文件下载次数,计算得到不同时间段的引用转化率数据;选择回归模型,根据引用转化率数据,利用曲线拟合方法进行拟合;根据拟合的结果,构建数据论文个体的影响力评价预测模型,利用该影响力评价预测模型,计算数据论文个体的某时间段的引用次数,实现影响力的评价或预测。本方法能够有效评价并预测各个数据论文的引用影响力情况。
-
公开(公告)号:CN110516146A
公开(公告)日:2019-11-29
申请号:CN201910635799.4
申请日:2019-07-15
Applicant: 中国科学院计算机网络信息中心
IPC: G06F16/9535 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于异质图卷积神经网络嵌入的作者名字消歧方法,其步骤为:1)对于一待消歧的目标作者名,收集以该目标作者名所著的出版物,然后根据所收集出版物的标题、作者列表和出版刊物信息构建出版物异质属性网络;2)根据所述出版物异质属性网络,通过基于元路径随机游走策略生成包含出版物节点邻居节点文本信息的路径;3)根据所述出版物异质属性网络以及所述路径,基于异质图卷积神经网络嵌入模型学习每一出版物的表征向量;4)根据所述出版物异质属性网络和所述出版物的表征向量,构建该目标作者名的出版物同质网络;5)对所述出版物同质网络进行划分,得到若干簇;其中同一簇中的出版物为同一人的出版物集合。
-
公开(公告)号:CN106156490B
公开(公告)日:2019-05-07
申请号:CN201610465029.6
申请日:2016-06-23
Applicant: 中国科学院计算机网络信息中心
Abstract: 本发明公开了一种基于气象数据的监测指标时空延迟相关性计算方法。本方法为:1)采集各地的气象数据和监测指标数据;2)对步骤1)的采集数据进行数据对齐,保留同一时刻同时存在的监测指标数据和气象数据;3)从步骤2)处理后的采集数据中分别提取监测地点A、B的设定时间段T内的监测指标数据及气象数据;4)保持地点A的监测指标数据X不变,地点B的监测指标数据Y向前多取t1个时刻的监测指标数据,以及向后多取t2个时刻的监测指标数据;5)对数据Y从数据起始向后移动采样窗口;在每次窗口移动时,计算数据Y移动后采样窗口内的数据与数据X之间的延迟相关性。本发明计算出的相关性更准确。
-
公开(公告)号:CN104572096B
公开(公告)日:2017-12-29
申请号:CN201410849397.1
申请日:2014-12-29
Applicant: 中国科学院计算机网络信息中心
IPC: G06F9/44
Abstract: 本发明涉及一种基于WEB的多模型数据可视化开发方法及平台。该可视化平台通过多模型驱动的方式实现对数据的解析及可视化图形的配置,包括数据配置模型和可视化配置模型;所述数据配置模型接收原始数据并对原始数据进行处理,解析出数据各维度的元数据结构,同时提供给用户多粒度的数据选择方式;所述可视化配置模型将所述数据配置模型的输出作为输入,选择相应的可视化图形,并智能推送可视化配置项,最终输出可视化结果。本发明能够解决不同平台、不同技术路线之间的集成和互操作性问题,定义良好的接口可适应将来出现的新数据源与可视化方法,能够提升开发效率,通过友好的人机交互满足用户对数据可视化的需求。
-
-
-
-
-