-
公开(公告)号:CN113051142A
公开(公告)日:2021-06-29
申请号:CN202110436268.X
申请日:2021-04-22
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种加固服务器健康管理中间件,其中,包括:传感器数据采集模块,控制自身的BMC模块通过其固件采集传感器数据;系统管理模块,对内部资源数据管理模块和传感器数据管理模块采集到的性能、资源信息进行统一管理;通信模块,将系统级健康数据按照约定的协议进行封装,定期通过报文发送至上层应用软件;告警模块,根据用户的配置设置告警阈值和告警策略,在每次收到从BMC模块返回的数据后,根据当前阈值对从BMC模块返回的数据进行比对,对超出阈值的数据进行标记并记录在日志中;智能决策模块,对每次获取的系统级健康数据中的风机数据进行保存形成历史数据,根据事先建立好的风机寿命预测模型,以历史数据为输入,预测风机寿命。
-
公开(公告)号:CN110488701A
公开(公告)日:2019-11-22
申请号:CN201910766915.6
申请日:2019-08-20
Applicant: 北京计算机技术及应用研究所
IPC: G05B19/042
Abstract: 本发明涉及基于国产化处理器的网络和FlexRay总线的高可用热备份方法,其中,包括:选定两块国产化龙芯3A2000主板作为互为冗余备份的双控制节点,发现主控节点失效时,将主节点进行复位,将对外通信切换到备用节点,同时备用节点不再进行任务同步操作,并发送一次节点切换报文;主节点检测到与上位机通信或下位机通信失效时,主动进行一次复位,备用节点从静默状态切换至工作状态,并不再执行任务同步操作并发送一次节点切换报文;若两个节点同时出现故障,则向上位机发送异常状态报文并对两个节点同时复位。本发明降低了数据传输在各个环节上的风险,全面实现了主控设备高可用热备份。
-
公开(公告)号:CN112131088B
公开(公告)日:2024-04-09
申请号:CN202011045239.2
申请日:2020-09-29
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种基于健康检查和容器的高可用方法,其中,包括:步骤1、采集当前时间点的数据;步骤2、如果采集的时间点个数小于p,则表示样本数不够,等待时间间隔T后进入步骤1,如果采集的时间点个数大于等于p,则进入步骤3;步骤3、删除多余的历史样本,保留p个时间点的样本数据,以p为行数,以关键数据n为列数构建p*n矩阵;步骤4、统计矩阵每列超过和低于健康状态参考范围的时间点次数;步骤5、若超过和低于健康状态范围的时间点次数大于k1且小于k2,则认为进入亚健康状态并提示告警,若次数大于k2则认为计算机临界故障,需要进行业务迁移。
-
公开(公告)号:CN111124852A
公开(公告)日:2020-05-08
申请号:CN201911145557.3
申请日:2019-11-21
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种基于BMC健康管理模块的故障预测方法及系统,该方法中使用BMC健康管理模块采集设备温度、电压等信息,并将所有数据记录到数据库中,BMC健康管理模块通过IPMI协议采集数据;根据设备中各硬件资源的使用标准与参数,对接收的数据进行分析,确定异常情况;通过BP神经网络预测方法,结合历史采样数据,选择模型参数,计算得到预测结果。本发明一种基于国产化BMC健康管理模块的故障预测方法及系统,能够使得故障预测更加合理,更加准确。
-
公开(公告)号:CN111629043B
公开(公告)日:2023-05-19
申请号:CN202010434429.7
申请日:2020-05-21
Applicant: 北京计算机技术及应用研究所
IPC: H04L67/10 , H04L67/51 , H04L41/0213 , H04L67/02
Abstract: 本发明涉及一种基于云端模式的跨平台健康管理系统,包括:数据采集层通过显控台端的健康管理中间件,采集显控台中各个组件的关键参数以及应用程序的运行状态信息;数据层作用在服务器和显控台上,服务器保留历史健康数据;数据层提供健康管理系统的所有数据资源,包括软件数据资源和硬件数据资源;支撑层为平台服务运行提供技术支撑和运维管理;服务层的数据处理服务接收来自显控台上设备故障状态及传感器数据;服务层状态监测接收来自数据处理及其他状态监测模块数据,涵盖硬件状态监测及应用软件状态监测,将监测数据与预设阈值进行比较以监测设备当前状态;应用层,用于部署应用软件。
-
公开(公告)号:CN112131088A
公开(公告)日:2020-12-25
申请号:CN202011045239.2
申请日:2020-09-29
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种基于健康检查和容器的高可用方法,其中,包括:步骤1、采集当前时间点的数据;步骤2、如果采集的时间点个数小于p,则表示样本数不够,等待时间间隔T后进入步骤1,如果采集的时间点个数大于等于p,则进入步骤3;步骤3、删除多余的历史样本,保留p个时间点的样本数据,以p为行数,以关键数据n为列数构建p*n矩阵;步骤4、统计矩阵每列超过和低于健康状态参考范围的时间点次数;步骤5、若超过和低于健康状态范围的时间点次数大于k1且小于k2,则认为进入亚健康状态并提示告警,若次数大于k2则认为计算机临界故障,需要进行业务迁移。
-
公开(公告)号:CN111629043A
公开(公告)日:2020-09-04
申请号:CN202010434429.7
申请日:2020-05-21
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种基于云端模式的跨平台健康管理系统,包括:数据采集层通过显控台端的健康管理中间件,采集显控台中各个组件的关键参数以及应用程序的运行状态信息;数据层作用在服务器和显控台上,服务器保留历史健康数据;数据层提供健康管理系统的所有数据资源,包括软件数据资源和硬件数据资源;支撑层为平台服务运行提供技术支撑和运维管理;服务层的数据处理服务接收来自显控台上设备故障状态及传感器数据;服务层状态监测接收来自数据处理及其他状态监测模块数据,涵盖硬件状态监测及应用软件状态监测,将监测数据与预设阈值进行比较以监测设备当前状态;应用层,用于部署应用软件。
-
公开(公告)号:CN114610551A
公开(公告)日:2022-06-10
申请号:CN202210216756.4
申请日:2022-03-07
Applicant: 北京计算机技术及应用研究所
IPC: G06F11/22 , G06F11/20 , G06F11/30 , H04L41/0663
Abstract: 本发明涉及一种基于FPGA故障检测的双机热备系统的实现方法,属于故障检测领域。本发明基于FPGA故障检测的双机热备系统硬件环境由两个集成了FPGA模块和传感器芯片的主板组成,分别作为主机和从机;每个主板均运行故障检测驱动软件,系统监控软件、IP迁移控制软件。所述双机热备系统能够在毫秒级时间内发现系统运行故障或硬件故障并执行主从切换,适用于对故障检测实时性要求高的应用场景。本发明通过FPGA模块进行故障检测,提升了故障检测的实时性,不仅能够对操作系统运行状态和关键进程状态进行检测,还能够针对硬件故障进行检测。
-
公开(公告)号:CN107609601B
公开(公告)日:2021-01-22
申请号:CN201710893876.7
申请日:2017-09-28
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明公开了一种基于多层卷积神经网络的舰船目标识别方法包括:S1、舰船样本库采用已有的图像、参数和模型数据构建,并在使用过程中,通过检测目标数据采集不断的进行丰富;S2、舰船目标特征训练是在卷积神经网络的框架下,通过对舰船样本库的识别训练,形成可见光/红外和二维/三维融合的舰船特征知识库,用于进行舰船目标分类识别;S3、舰船目标数据采集用于对海上舰船目标的可见光或红外视频数据进行实时高分辨率的采集;S4、对海上舰船目标进行检测;S5、对舰船目标图像粗分类;S6、基于舰船目标特征训练完成的深度神经网络模型开展舰船目标的细分类识别工作,准确的识别出舰船的类型。解决了舰船目标识别的难题。
-
公开(公告)号:CN110177020A
公开(公告)日:2019-08-27
申请号:CN201910524257.X
申请日:2019-06-18
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种基于Slurm的高性能集群管理方法,包括:任意选定一台机器作为控制节点,其它机器作为计算节点;获取到集群中所有计算节点的主机名或IP信息,将集群安装包和安装脚本拷贝到各个计算节点;在控制节点上通过SSH服务登录到各个计算节点,通过安装脚本完成节点上集群环境的搭建部署;在控制节点部署控制接收进程,用于监控计算资源,接收计算节点发送的信息;在各个计算节点上存在守护进程用来管控集群中的计算节点,定时采集节点状态以及节点上信息并通过SSH服务发送给控制节点;对计算节点及冗余备份节点的进行协同管理;基于Slurm作业管理机制和节点状态监控进程,依据集群系统资源的当前状况对队列中的作业进行部署、监控、和分配操作。
-
-
-
-
-
-
-
-
-