-
公开(公告)号:CN107590008A
公开(公告)日:2018-01-16
申请号:CN201710651527.4
申请日:2017-08-02
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种通过加权熵判断分布式集群可靠度的方法和系统,属于分布式集群可靠性领域,通过预先为不同严重性的日志事件分别进行赋权,然后利用滑动窗口统计该时段内集群各节点的不同类型系统日志数量,进而计算各节点的错误率,并根据该错误率计算集群的可靠性加权熵,最后根据波动大小判断集群稳定性。通过该方法量化了系统可靠性,不但可以通过简单部署就能对整个集群的可靠性进行量化判定,而且还可对集群的稳定程度进行实时监控,及时了解集群的环境变化,当集群的可靠性出现较大波动时可及时采取相应措施处理。
-
公开(公告)号:CN104077266B
公开(公告)日:2017-07-07
申请号:CN201310101210.5
申请日:2013-03-27
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
IPC: G06F15/177
CPC classification number: G06F9/5016
Abstract: 本发明实施例提供一种多内核操作系统实现方法和实现装置及系统,其中,该方法包括:为多内核操作系统的各内核的基础功能模块分配内存;为从所述各内核中选取的第一内核中支持第一应用程序的特性功能模块分配内存;将所述为所述第一内核中支持第一应用程序的特性功能模块分配的内存释放。本发明实施例提供的多内核操作系统实现方法和实现装置及系统,实现了基于应用程序的特性,按需为内核的相应功能分配内存,从而提高了多内核操作系统的系统管理效率和资源使用效率。
-
公开(公告)号:CN104346380A
公开(公告)日:2015-02-11
申请号:CN201310330196.6
申请日:2013-07-31
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
CPC classification number: G06F17/30958
Abstract: 基于MapReduce模型的数据排序方法和系统,其中排序方法包括步骤:在MAP阶段每个MAP模块在对数据分块中的元素排序过程中,每确定一个元素的排序结果后,即将该元素加入先入先出数据结构中;在Reduce阶段Reduce模块获取所有先入先出数据结构中的当前元素;获取当前全局极值元素;将当前全局极值元素作为排序结果输出;将输出的当前全局极值元素从所述Reduce阶段元素集中移除,并更新Reduce阶段元素集。通过本申请,不必要等待MAP阶段的排序过程完成,即可在Reduce阶段根据先入先出缓存队列中的当前元素中选取极值元素,并流式的输出排序结果,所以可以提前输出排序结果,以减少用户的等待时间。
-
公开(公告)号:CN101888309B
公开(公告)日:2012-07-04
申请号:CN201010221973.X
申请日:2010-06-30
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种在线日志分析方法,包括:从机群系统的各个节点上在线获取日志文件;根据日志文件定义事件序列与事件关联规则,然后统计一元事件序列,找出频繁的一元事件序列集合,得到二元频繁事件序列候选集C(2);统计C(2)中候选二元频繁事件序列的支持度计数和后验度计数,计算置信度和后验度;生成二元频繁事件序列集合F(2)和二元规则集合R(2);重复这一过程直到得到F(k)和R(k),对F(k)中的k元频繁事件序列进行连接操作,产生F(k+1)元频繁事件序列集合;对在F(k+1)中且不在R(k+1)的元素的属性值进行近似计算,直到产生所有的频繁事件序列;由频繁事件序列找到事件关联规则;根据事件关联规则在线预测日志中的事件。
-
公开(公告)号:CN101968747A
公开(公告)日:2011-02-09
申请号:CN201010286186.3
申请日:2010-09-17
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种机群应用管理系统,该系统包括执行引擎模块和数据库模块,数据库模块用于实时地存储各应用的处理结果,并建立监控表,所述监控表中记录多个应用的所有关联应用的处理结果的改变信息;执行引擎模块用于执行机群系统中的各个应用,并将各应用的处理结果实时地写入数据库模块,还用于按照所设定的周期定期读取数据库模块中的所述监控表,每次读取所述监控表后根据所读取的多个应用的处理结果的改变信息,分别判断各应用的触发条件是否已满足,并在触发条件满足时触发相应的应用。本发明还提供了相应的机群应用管理方法。本发明能够减少数据库访问连接数,降低开销;能够处理应用间各种复杂逻辑关系;更加便于管理和操作。
-
公开(公告)号:CN101888309A
公开(公告)日:2010-11-17
申请号:CN201010221973.X
申请日:2010-06-30
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种在线日志分析方法,包括:从机群系统的各个节点上在线获取日志文件;根据日志文件定义事件序列与事件关联规则,然后统计一元事件序列,找出频繁的一元事件序列集合,得到二元频繁事件序列候选集C(2);统计C(2)中候选二元频繁事件序列的支持度计数和后验度计数,计算置信度和后验度;生成二元频繁事件序列集合F(2)和二元规则集合R(2);重复这一过程直到得到F(k)和R(k),对F(k)中的k元频繁事件序列进行连接操作,产生F(k+1)元频繁事件序列集合;对在F(k+1)中且不在R(k+1)的元素的属性值进行近似计算,直到产生所有的频繁事件序列;由频繁事件序列找到事件关联规则;根据事件关联规则在线预测日志中的事件。
-
公开(公告)号:CN116451754A
公开(公告)日:2023-07-18
申请号:CN202310310363.4
申请日:2023-03-24
Applicant: 中国科学院计算技术研究所
IPC: G06N3/063 , G06N3/0464 , G06N3/048 , G06F9/48
Abstract: 本发明提供了一种支持多层神经网络的层间并行处理的加速器,包括:计算阵列;用于获取一个或者多个数据块上存储的多层神经网络中,已可用于后续计算的层内和/或层间数据作为重组数据并重组成预设重组粒度的重组数据矩阵以及获取对重组数据矩阵处理所需的网络参数并重排成重组权重矩阵的第一重排器;用于在计算阵列处理重组矩阵时获取重组数据矩阵对应的预设重组粒度,指示计算阵列中各处理单元按照预设重组粒度获取重组数据矩阵中的数据和重排权重矩阵中对应的权重进行处理的扩展模块;用于在计算阵列对所述重组数据矩阵处理完成后,根据处理各数据得到的结果按结果原始形式进行结果重组以还原网络层的输出的第二重组器。
-
公开(公告)号:CN104102535B
公开(公告)日:2018-10-02
申请号:CN201310112322.0
申请日:2013-04-01
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
IPC: G06F9/48
Abstract: 本发明实施例提供一种进程迁移方法和可迁移操作系统。本发明进程迁移方法,包括:在多内核操作系统的至少一个内核上存储的全局信息表中维护所有内核中进程的进程相关信息;监测是否产生进程迁移触发条件;当监测到产生进程迁移触发条件时,从所述全局信息表中提取源内核上待迁移进程对应的进程相关信息;根据所述进程相关信息获取所述待迁移进程的进程数据;根据所述进程数据将待迁移进程从源内核迁移至目标内核上运行。本发明实施例通过维护内核上进程相关信息,当某个内核失效时根据进程相关信息将待迁移进程迁移至其他内核运行,实现在较小系统开销下保证操作系统的高容错性,解决由于系统开销大影响操作系统性能的问题。
-
公开(公告)号:CN103257923B
公开(公告)日:2016-12-28
申请号:CN201310131986.1
申请日:2013-04-16
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F11/36
Abstract: 本发明公开了一种数据中心数据分析类基准测试程序的应用选取方法及系统,该方法执行于数据中心计算机系统中,包括:步骤一,从多种应用领域中分别选取至少一个应用,组成应用集,该应用集覆盖了特定种类的编程模型;步骤二,运行该应用集中的所有应用,针对每个应用,都分别获取预定性能指标的参数值;步骤三,将各个应用所对应的该参数值分别组成一个特征向量,对所有特征向量进行聚类;步骤四,在聚类得到的每个类中,选择距离类中心点最近和最远的两个应用作为基准测试程序的应用进行基准测试。
-
公开(公告)号:CN104657240A
公开(公告)日:2015-05-27
申请号:CN201310577042.7
申请日:2013-11-18
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
IPC: G06F11/20
Abstract: 本发明实施例公开了一种多内核操作系统的失效控制方法及装置。其中,方法包括:确定操作系统内的重核心内核以及多个轻核心内核;在重核心内核和多个轻核心内核上运行相应的系统服务,重核心内核以及多个轻核心内核均保存有所有内核的状态信息;监测重核心内核和多个轻核心内核的状态;当重核心内核出现故障时,则在多个轻核心内核中确定出新的重核心内核,将原重核心内核上运行的系统服务转移至新的重核心内核上,由新的重核心内核和多个轻核心内核更新相应内核的状态信息;当轻核心内核出现故障时,则将故障轻核心内核上运行的系统服务转移至其他正常轻核心内核,由重核心内核和多个轻核心内核更新相应内核的状态信息。
-
-
-
-
-
-
-
-
-