面向新一代异构超算大模型并行训练与推理适配优化方法

    公开(公告)号:CN119783812A

    公开(公告)日:2025-04-08

    申请号:CN202411785151.2

    申请日:2024-12-06

    Applicant: 湖南大学

    Abstract: 本申请涉及一种面向新一代异构超算大模型并行训练与推理适配优化方法,获取模型上下文关系与层间张量依赖关系,基于模型上下文关系与层间张量依赖关系构建有向无环依赖关系图,并根据有向无环依赖关系图封装算子,得到迭代执行队列;分配通信模块至并行计算中各计算节点,由各计算节点根据迭代执行队列执行相应的批量迭代任务;在迭代执行队列执行过程中,各计算节点在分配的通信模块内启动算子引擎,切分并重排张量数据,通过通信模块进行计算节点内并行张量计算,直至迭代执行队列内数据处理完毕;归集各计算节点的计算结果,得到迭代任务计算结果。采用批量划分手段将迭代批量任务划分至各个计算节点进行并行计算,实现了高效的数据处理。

    调度任务的生成方法、装置、计算机设备和存储介质

    公开(公告)号:CN118093112A

    公开(公告)日:2024-05-28

    申请号:CN202311549618.9

    申请日:2023-11-20

    Applicant: 湖南大学

    Abstract: 本申请涉及一种调度任务的生成方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取神经网络模型中各网络层的模型参数,以及用于运行神经网络模型的运算核心对应的核心参数,根据神经网络模型中各网络层的连接方向,生成调度任务,根据各网络层的模型参数、核心参数以及初始调度关系,对调度任务的执行时长进行预测,得到调度任务的预测时长;调整调度任务中的初始调度关系,直到满足调整停止条件,将调整得到的预测时长最短的调度任务,确定为待执行的目标调度任务,该方法,调整调度任务中初始调度关系,通过选择预测时长的调度任务作为待执行的目标调度任务,快速得到待执行的目标调度任务,提高了调度任务生成效率。

Patent Agency Ranking