一种HPC间接网络环境下的链路故障检测方法

    公开(公告)号:CN108650110B

    公开(公告)日:2021-01-08

    申请号:CN201810256843.6

    申请日:2018-03-27

    Abstract: 本发明提供一种HPC间接网络环境下的链路故障检测方法,应用于HPC间接网络环境下,基于链路延迟信息测量的链路故障检测方法,通过检测链路延迟信息的异常来检测链路故障,能保证在较短时间内较精准的确定网络中故障链路。包括以下步骤:(a)查询HPC互连网络路由信息,获得结点间通信路径的链路组成;(b)结合各通信路径的链路组成,确定需要进行延迟测量的关键通信路径集合;(c)并行测量关键路径的延迟信息,并据此信息求解出全网所有链路的延迟信息;(d)根据链路延迟信息判断链路是否发生故障;求解网络中链路延迟的期望值,延迟与该值存在较大偏差的链路即为故障链路。

    一种HPC间接网络环境下的链路故障检测方法

    公开(公告)号:CN108650110A

    公开(公告)日:2018-10-12

    申请号:CN201810256843.6

    申请日:2018-03-27

    Abstract: 本发明提供一种HPC间接网络环境下的链路故障检测方法,应用于HPC间接网络环境下,基于链路延迟信息测量的链路故障检测方法,通过检测链路延迟信息的异常来检测链路故障,能保证在较短时间内较精准的确定网络中故障链路。包括以下步骤:(a)查询HPC互连网络路由信息,获得结点间通信路径的链路组成;(b)结合各通信路径的链路组成,确定需要进行延迟测量的关键通信路径集合;(c)并行测量关键路径的延迟信息,并据此信息求解出全网所有链路的延迟信息;(d)根据链路延迟信息判断链路是否发生故障;求解网络中链路延迟的期望值,延迟与该值存在较大偏差的链路即为故障链路。

Patent Agency Ranking