-
公开(公告)号:CN103617094A
公开(公告)日:2014-03-05
申请号:CN201310695327.0
申请日:2013-12-18
Applicant: 哈尔滨工业大学
Abstract: 本发明提供了一种多核处理器的瞬时故障容错系统,包括:故障检测分析子系统、进程监控子系统和检查点设置及恢复子系统;所述检查点设置及恢复子系统包括:用户态命令模块、libcr库函数模块和进程保护恢复内核模块;所述用户调用接口模块用于向所述进程保护恢复内核模块发送检查点的保存和恢复的请求并显示操作结果;所述libcr库函数模块用于触发进程进行检查点的保存和恢复;所述进程保护恢复内核模块用于接收所述用户调用接口模块发送的检查点的保存和恢复请求,并在执行对所述进程的运行信息的检查点的保存和恢复的操作后返回操作结果。本发明能够较好地提高计算机系统的可靠性,并提高计算机从瞬时故障中恢复的能力。
-
公开(公告)号:CN103678013A
公开(公告)日:2014-03-26
申请号:CN201310696234.X
申请日:2013-12-18
Applicant: 哈尔滨工业大学
IPC: G06F11/00
Abstract: 本发明提供了一种多核处理器操作系统级进程冗余检测系统,包括:缓存模块、同步模块、检测模块和故障恢复接口模块;所述缓存模块用于缓存所述多核处理器操作系统的系统调用的关键数据;所述同步模块用于完成各个子进程之间横向与纵向的时间同步;所述检测模块用于比较各个子进程系统调用的缓存数据是否相同,若不相同则生成故障标志;所述故障恢复接口模块用于向外部提供所述故障标志及所述关键数据,如果当前检测正常则传递还原点创建标志,并提供创建还原点必要的关键性数据,否则传递故障恢复标志。本发明能够兼顾各个层次的优点,是一种相对灵活但又不失性能损失的检测方案。
-