一种HPC间接网络环境下的链路故障检测方法

    公开(公告)号:CN108650110A

    公开(公告)日:2018-10-12

    申请号:CN201810256843.6

    申请日:2018-03-27

    Abstract: 本发明提供一种HPC间接网络环境下的链路故障检测方法,应用于HPC间接网络环境下,基于链路延迟信息测量的链路故障检测方法,通过检测链路延迟信息的异常来检测链路故障,能保证在较短时间内较精准的确定网络中故障链路。包括以下步骤:(a)查询HPC互连网络路由信息,获得结点间通信路径的链路组成;(b)结合各通信路径的链路组成,确定需要进行延迟测量的关键通信路径集合;(c)并行测量关键路径的延迟信息,并据此信息求解出全网所有链路的延迟信息;(d)根据链路延迟信息判断链路是否发生故障;求解网络中链路延迟的期望值,延迟与该值存在较大偏差的链路即为故障链路。

    一种HPC间接网络环境下的链路故障检测方法

    公开(公告)号:CN108650110B

    公开(公告)日:2021-01-08

    申请号:CN201810256843.6

    申请日:2018-03-27

    Abstract: 本发明提供一种HPC间接网络环境下的链路故障检测方法,应用于HPC间接网络环境下,基于链路延迟信息测量的链路故障检测方法,通过检测链路延迟信息的异常来检测链路故障,能保证在较短时间内较精准的确定网络中故障链路。包括以下步骤:(a)查询HPC互连网络路由信息,获得结点间通信路径的链路组成;(b)结合各通信路径的链路组成,确定需要进行延迟测量的关键通信路径集合;(c)并行测量关键路径的延迟信息,并据此信息求解出全网所有链路的延迟信息;(d)根据链路延迟信息判断链路是否发生故障;求解网络中链路延迟的期望值,延迟与该值存在较大偏差的链路即为故障链路。

    一种科学计算应用影像区交换通信模式的卸载实现方法

    公开(公告)号:CN109743350B

    公开(公告)日:2020-11-03

    申请号:CN201811450795.0

    申请日:2018-11-30

    Abstract: 本发明提供一种科学计算应用影像区交换通信模式的卸载实现方法,保证应用执行该种数据通信模式时的高可拓展、低延迟性。包括以下步骤:(a)通过新的数据缓冲区管理机制进行传输数据的注册、管理与注销操作,以消除网络接口卡到科学计算应用程序缓冲区的不必要副本,提高网络带宽并减少通信延迟;(b)数据的传输采用远程直接数据存取的方法,根据影像区交换通信模式中传输数据的大小与进程间的数据依赖情况,灵活地选取多种传输协议;(c)将网络接口卡中的传输通道分为共享RDMA通道与独占RDMA通道,使密集通信或传输数据量较大的两进程间构建独占的RDMA通道进行数据通信,而其余进程间通信则共享部分通道实现。

    运行于RDMA通信环境的并行应用通信性能预测方法

    公开(公告)号:CN112383443B

    公开(公告)日:2022-06-14

    申请号:CN202011000919.2

    申请日:2020-09-22

    Abstract: 本发明提出运行于RDMA通信环境的并行应用通信性能预测方法,用于预测采用RDMA技术的并行应用的通信性能。该方法首先构建了RDMA技术下的点对点通信性能模型,保证通信性能模型对目标并行应用的适用性;随后分析需要进行通信开销预测的并行应用,利用通信时序代替真实通信过程,确定刻画该应用的通信所需的网络性能参数,并设计所需网络性能参数的测量过程进行测量,最终根据通信时序与网络性能参数计算出应用通信的理论开销,实现对并行应用通信的预测。该方法在较短的时间内较为准确预测并行应用通信性能,适用于使用RDMA技术通信的并行应用。

    一种科学计算应用影像区交换通信模式的卸载实现方法

    公开(公告)号:CN109743350A

    公开(公告)日:2019-05-10

    申请号:CN201811450795.0

    申请日:2018-11-30

    Abstract: 本发明提供一种科学计算应用影像区交换通信模式的卸载实现方法,保证应用执行该种数据通信模式时的高可拓展、低延迟性。包括以下步骤:(a)通过新的数据缓冲区管理机制进行传输数据的注册、管理与注销操作,以消除网络接口卡到科学计算应用程序缓冲区的不必要副本,提高网络带宽并减少通信延迟;(b)数据的传输采用远程直接数据存取的方法,根据影像区交换通信模式中传输数据的大小与进程间的数据依赖情况,灵活地选取多种传输协议;(c)将网络接口卡中的传输通道分为共享RDMA通道与独占RDMA通道,使密集通信或传输数据量较大的两进程间构建独占的RDMA通道进行数据通信,而其余进程间通信则共享部分通道实现。

    基于文本分析的MPI代码通信过程解析方法

    公开(公告)号:CN109710419B

    公开(公告)日:2022-04-08

    申请号:CN201811345110.6

    申请日:2018-11-13

    Abstract: 本发明提供一种基于文本分析的MPI代码通信过程解析方法,应用于基于MPI开发的并行应用程序中,基于文本分析的MPI代码通信过程解析方式,通过对MPI并行应用源代码分析,模拟MPI任务的执行过程快速准确地挖掘出点对点通信信息,减少分析过程中的资源开销。包括以下步骤:(a)对MPI源代码逐行分析,抓取出关键通信变量;(b)根据用户期望启动的进程数,对源代码执行相应次数的循环分析,每次循环分析模拟一个MPI任务的执行;(c)每次循环时,根据解析到的不同的关键词语句执行相应的分析过程,搜索是否包含MPI通信关键词;(d)根据搜索到的不同的MPI通信关键词,将通信过程转换为点对点通信信息;(e)整合多个进程中的点对点通信信息。

    基于文本分析的MPI代码通信过程解析方法

    公开(公告)号:CN109710419A

    公开(公告)日:2019-05-03

    申请号:CN201811345110.6

    申请日:2018-11-13

    Abstract: 本发明提供一种基于文本分析的MPI代码通信过程解析方法,应用于基于MPI开发的并行应用程序中,基于文本分析的MPI代码通信过程解析方式,通过对MPI并行应用源代码分析,模拟MPI任务的执行过程快速准确地挖掘出点对点通信信息,减少分析过程中的资源开销。包括以下步骤:(a)对MPI源代码逐行分析,抓取出关键通信变量;(b)根据用户期望启动的进程数,对源代码执行相应次数的循环分析,每次循环分析模拟一个MPI任务的执行;(c)每次循环时,根据解析到的不同的关键词语句执行相应的分析过程,搜索是否包含MPI通信关键词;(d)根据搜索到的不同的MPI通信关键词,将通信过程转换为点对点通信信息;(e)整合多个进程中的点对点通信信息。

    基于Q-Learning的并行应用多维度通信性能拓扑映射优化指导方法

    公开(公告)号:CN114048044A

    公开(公告)日:2022-02-15

    申请号:CN202111294103.X

    申请日:2021-11-03

    Abstract: 本发明提出一种基于Q‑Learning的并行应用多维度通信性能拓扑映射优化指导方法,主要目的是通过调整多维度优化指标中各指标权重,准确地指导多维度优化指标的拓扑映射方法优化方向,进而获取更优的并行应用多维度通信性能拓扑映射方案。本发明首先确定Q‑table结构、奖励机制、更新函数,然后利用Q‑Learning算法更新Q‑table信息,为当前状态选择一个较为合适的动作,进而逐步逼近最佳状态,获得更优的并行应用多维度通信性能拓扑映射优化方向。与同类方法相比,本发明可以快速并准确地解决多维度优化函数的权重调整问题,从而更好地优化并行应用通信性能。

    运行于RDMA通信环境的并行应用通信性能预测方法

    公开(公告)号:CN112383443A

    公开(公告)日:2021-02-19

    申请号:CN202011000919.2

    申请日:2020-09-22

    Abstract: 本发明提出运行于RDMA通信环境的并行应用通信性能预测方法,用于预测采用RDMA技术的并行应用的通信性能。该方法首先构建了RDMA技术下的点对点通信性能模型,保证通信性能模型对目标并行应用的适用性;随后分析需要进行通信开销预测的并行应用,利用通信时序代替真实通信过程,确定刻画该应用的通信所需的网络性能参数,并设计所需网络性能参数的测量过程进行测量,最终根据通信时序与网络性能参数计算出应用通信的理论开销,实现对并行应用通信的预测。该方法在较短的时间内较为准确预测并行应用通信性能,适用于使用RDMA技术通信的并行应用。

Patent Agency Ranking