-
公开(公告)号:CN114356838B
公开(公告)日:2024-08-13
申请号:CN202210013518.3
申请日:2022-01-06
Applicant: 西安交通大学
IPC: G06F15/173
Abstract: 本发明公开了一种基于MPI模型的共享内存点对点阻塞通信建模方法及系统,首先确定通信位于共享内存上的何种通信信道上以及使用的通信协议,接下来建模完全异步的点对点通信,之后建模同步开始情况下的点对点通信,最后将空等时间表示在通信开销中。本发明相比于基于MPI硬件通信性能模型的阻塞点对点通信建模方法和基于MPI软件通信性能模型的常规点对点通信建模方式,提供了对更多信道建模的同时,也加强了对中间件相关特性建模的能力,可以很好的对共享内存上的点对点通信进行建模,精度得到显著提升。
-
公开(公告)号:CN119676099A
公开(公告)日:2025-03-21
申请号:CN202411941181.8
申请日:2024-12-26
Applicant: 西安交通大学
IPC: H04L41/14 , H04L41/147
Abstract: 本发明公开了一种多节点MPI集合通信性能建模方法及系统,首先根据节点内多核处理器信息和平台网络层次信息,确定所需测量的模型参数;然后在平台上测量节点内通信参数以及位于不同网络层次上的节点间通信参数;接下来分析集合通信源码并模拟通信算法行为,获得算法每一轮通信的所有通信特征;最后结合通信特征选择对应的参数,将每一轮的通信时间用对应参数的数学公式表示。本发明相比于现有模型,引入了超算网络层次结构信息和通信算法底层使用的点对点通信原语类型,将模型应用范围由单节点共享内存模型拓展至多节点共享内存和互连网络的混合模型,模型能够更精准地预测多节点集合通信操作的通信时间。
-
公开(公告)号:CN116095177B
公开(公告)日:2024-11-08
申请号:CN202310082477.8
申请日:2023-02-03
Applicant: 西安交通大学
IPC: H04L67/61 , H04L67/62 , H04L67/63 , H04L67/1008
Abstract: 本发明公开了一种分层分簇调度方法、系统、介质及设备,采集集群的各类资源数据、生成节点延迟矩阵;根据调度任务的一般容忍调用响应时间选择合适的延迟分层调度,查找当前选择的延迟分层是否存在,如果不存在则使用完全子图划分方法对集群节点组成的图进行分簇,分簇完成后将分簇信息以不同延迟标准分层保存,如果存在则读取当前延迟分层的分簇信息;然后依据簇群优先级公式计算各个簇群的优先级,选择优先级高的簇群进行调度。本发明通过将任务限制在簇群中调度,能够显著降低由节点间高延迟带来的任务响应时间过大的性能开销。
-
公开(公告)号:CN116095177A
公开(公告)日:2023-05-09
申请号:CN202310082477.8
申请日:2023-02-03
Applicant: 西安交通大学
IPC: H04L67/61 , H04L67/62 , H04L67/63 , H04L67/1008
Abstract: 本发明公开了一种分层分簇调度方法、系统、介质及设备,采集集群的各类资源数据、生成节点延迟矩阵;根据调度任务的一般容忍调用响应时间选择合适的延迟分层调度,查找当前选择的延迟分层是否存在,如果不存在则使用完全子图划分方法对集群节点组成的图进行分簇,分簇完成后将分簇信息以不同延迟标准分层保存,如果存在则读取当前延迟分层的分簇信息;然后依据簇群优先级公式计算各个簇群的优先级,选择优先级高的簇群进行调度。本发明通过将任务限制在簇群中调度,能够显著降低由节点间高延迟带来的任务响应时间过大的性能开销。
-
公开(公告)号:CN116015635A
公开(公告)日:2023-04-25
申请号:CN202211601017.3
申请日:2022-12-13
Applicant: 西安交通大学
Abstract: 本发明公开了一种GPU用抗量子攻击XMSS签名方法并行实现方法及系统,通过两层并行方法,包括第一层结构上的并行,第二层的Winternitz一次性签名相关结构和L树构建的并行,结合多级并行方案的决策,得到一个GPU上抗量子攻击XMSS签名方法的并行高效实现。通过两层并行方法,包括第一层结构上的并行,第二层的相关结构和L树构建的并行,结合多级并行方案的决策,实现了XMSS算法在GPU上的高效并行执行。
-
公开(公告)号:CN115934092B
公开(公告)日:2025-05-13
申请号:CN202210907513.5
申请日:2022-07-29
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于SHA‑256算法的并行调度实现方法、系统、介质及设备,针对申威26010处理器,设计SHA‑256算法的并行调度实现。通过全方面的性能优化,包括编译选项优化、DMA传输优化、并行调度优化、指令减少优化以及汇编级别的循环展开和双发射技术优化,得到一个SHA‑256算法的并行调度高效实现。相比于优化过访存效率的原始SHA‑256算法实现,对于1MB消息的哈希计算,运行时间从45.01s减少到16.25s,运行效率提升了2.77倍。
-
公开(公告)号:CN113806126B
公开(公告)日:2025-04-15
申请号:CN202111044500.1
申请日:2021-09-07
Applicant: 西安交通大学
Abstract: 本发明公开了一种应对突发性故障的云应用续算方法及系统,在云计算集群中指定一个执行云应用的执行节点和负责监督对应执行节点执行的监督节点;执行节点运行云应用执行程序,监督节点运行监听程序;当监听程序监测到执行节点中的云应用发生异常时,监听程序所在监督节点启动云应用续算处理,接续完成被中断云应用未完成的计算工作。本发明实现了快速的云计算任务故障发现与容错续算处理,同时,相较于现有容错方式更加节约云平台的计算、存储、通信资源,并且有效减少了云平台管理节点的容错管理负载。
-
公开(公告)号:CN117040792A
公开(公告)日:2023-11-10
申请号:CN202310834273.5
申请日:2023-07-07
Applicant: 西安交通大学
Abstract: 本发明公开了一种GPU用抗量子攻击SPHINCS+签名算法并行实现方法及系统,通过四层并行策略,包括第一级树间并行,第二级节点间并行,第三级节点内部并行和第四级哈希函数并行,结合多级并行方案的决策,得到一种GPU用抗量子攻击SPHINCS+签名方法的并行实现方法。通过对并行、部署和实现模块进行设计,得到了一种GPU用抗量子攻击SPHINCS+签名方法的并行实现系统。
-
公开(公告)号:CN116260588A
公开(公告)日:2023-06-13
申请号:CN202211604636.8
申请日:2022-12-13
Applicant: 西安交通大学
IPC: H04L9/32
Abstract: 本发明公开了一种GPU用单密钥对数据并行方法、系统、介质及设备,通过在XMSS签名时对XMSS树构造过程的重用以及进行Winternitz一次性签名和构建XMSS树的线程数负载均衡,在并行构建XMSS树中对认证路径和根节点进行高效选择以及提供高可配置的WOTS+签名的并行执行方法,实现XMSS算法的高效单密钥对数据并行签名;通过部署任务分配和多流方案,实现了XMSS算法的高效单密钥对数据并行签名验证。
-
公开(公告)号:CN115934092A
公开(公告)日:2023-04-07
申请号:CN202210907513.5
申请日:2022-07-29
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于SHA‑256算法的并行调度实现方法、系统、介质及设备,针对申威26010处理器,设计SHA‑256算法的并行调度实现。通过全方面的性能优化,包括编译选项优化、DMA传输优化、并行调度优化、指令减少优化以及汇编级别的循环展开和双发射技术优化,得到一个SHA‑256算法的并行调度高效实现。相比于优化过访存效率的原始SHA‑256算法实现,对于1MB消息的哈希计算,运行时间从45.01s减少到16.25s,运行效率提升了2.77倍。
-
-
-
-
-
-
-
-
-