一种内存管理方法、装置、设备及介质

    公开(公告)号:CN114020454B

    公开(公告)日:2025-05-13

    申请号:CN202111257276.4

    申请日:2021-10-27

    Abstract: 本申请公开了一种内存管理方法、装置、设备及介质,包括:对异构加速计算系统的主机端的内存和各AI加速器设备的板载内存分别进行切片处理,得到相应的内存切片空间;从全部所述内存切片空间中确定出公共内存切片空间;对全部所述公共内存切片空间进行统一地址空间编址,得到相应的编址空间;在执行人工智能算法计算任务时,将人工智能算法模型部署于所述编址空间,以便各处理器访问所述编址空间中相应的公共内存切片空间,完成所述人工智能算法计算任务。能够突破AI异构加速设备间的内存物理隔离限制,提高异构加速计算系统的计算资源和内存资源利用效率。

    基于能耗的异构计算系统任务处理方法、系统以及产品

    公开(公告)号:CN119200811B

    公开(公告)日:2025-05-06

    申请号:CN202411732111.1

    申请日:2024-11-29

    Abstract: 本发明公开了一种基于能耗的异构计算系统任务处理方法、系统以及产品,涉及计算机技术领域。依据当前训练任务的任务需求参数确定预选异构算力设备,保证当前的训练任务在执行过程中能够顺利完成的前提下确定的预选异构算力设备的数量。选取与预选异构算力设备的数量相同预选存储设备,保证预选异构算力设备与预选存储设备呈现匹配一一对应的关系。基于各预选异构算力设备与各预先存储设备之间的各个组合关系和能耗确定最终能耗,利用能耗优化处理的能耗特征,对各预选异构算力设备与各预选存储设备下的不同组合关系确定的优化处理方式,提高各预选异构算力设备与各预选存储设备的匹配度,降低各预选异构算力设备与各预选存储设备之间的能耗。

    异构计算系统的检查点部署方法、系统、产品以及装置

    公开(公告)号:CN119226092B

    公开(公告)日:2025-03-21

    申请号:CN202411732114.5

    申请日:2024-11-29

    Abstract: 本发明公开了一种异构计算系统的检查点部署方法、系统、产品以及装置,涉及计算机技术领域。根据各异构算力设备的需求参数计算在每个存储设备上部署检查点时各存储设备对应的故障恢复耗时期望值,以权衡各异构算力设备的各需求参数对应检查点恢复的影响。根据各异构算力设备的需求参数和故障恢复耗时期望值确定初步的第一检查点部署关系,以实现在部署过程中针对于各异构算力设备的特性参数对应部署检查点到各个存储设备的局部最优选择的可预测性。根据初步的第一检查点部署关系,通过各异构算力设备的部署位置进行优化确定第二检查点部署关系,有效跳出局部最优解增加找到全局最优解的可能性,提高训练任务的执行效率。

    基于能耗的异构计算系统任务处理方法、系统以及产品

    公开(公告)号:CN119200811A

    公开(公告)日:2024-12-27

    申请号:CN202411732111.1

    申请日:2024-11-29

    Abstract: 本发明公开了一种基于能耗的异构计算系统任务处理方法、系统以及产品,涉及计算机技术领域。依据当前训练任务的任务需求参数确定预选异构算力设备,保证当前的训练任务在执行过程中能够顺利完成的前提下确定的预选异构算力设备的数量。选取与预选异构算力设备的数量相同预选存储设备,保证预选异构算力设备与预选存储设备呈现匹配一一对应的关系。基于各预选异构算力设备与各预先存储设备之间的各个组合关系和能耗确定最终能耗,利用能耗优化处理的能耗特征,对各预选异构算力设备与各预选存储设备下的不同组合关系确定的优化处理方式,提高各预选异构算力设备与各预选存储设备的匹配度,降低各预选异构算力设备与各预选存储设备之间的能耗。

    异构算力的耗时预测仿真方法、装置、设备、介质及系统

    公开(公告)号:CN117827619B

    公开(公告)日:2024-05-24

    申请号:CN202410230017.X

    申请日:2024-02-29

    Abstract: 本发明公开了计算机技术领域内的一种异构算力的耗时预测仿真方法、装置、设备、介质及系统。本发明能够构建包括通信图节点和计算图节点的有向图,从而根据多个异构算力设备的网络拓扑信息仿真得到的仿真网络预测多个通信图节点的通信耗时,根据有向图预测多个计算图节点的计算耗时,累计通信耗时和计算耗时得到模型训练任务的训练耗时。由于无需部署实际的算力设备,因此没有部署难度,实现成本低,可根据预测的训练耗时优化算力设备的部署策略,预测准确度更高,适用于多元异构计算系统。

    异构算力的耗时预测仿真方法、装置、设备、介质及系统

    公开(公告)号:CN117827619A

    公开(公告)日:2024-04-05

    申请号:CN202410230017.X

    申请日:2024-02-29

    Abstract: 本发明公开了计算机技术领域内的一种异构算力的耗时预测仿真方法、装置、设备、介质及系统。本发明能够构建包括通信图节点和计算图节点的有向图,从而根据多个异构算力设备的网络拓扑信息仿真得到的仿真网络预测多个通信图节点的通信耗时,根据有向图预测多个计算图节点的计算耗时,累计通信耗时和计算耗时得到模型训练任务的训练耗时。由于无需部署实际的算力设备,因此没有部署难度,实现成本低,可根据预测的训练耗时优化算力设备的部署策略,预测准确度更高,适用于多元异构计算系统。

    基于多模态预训练模型的三维内容生成方法及相关组件

    公开(公告)号:CN117473105B

    公开(公告)日:2024-04-05

    申请号:CN202311827111.5

    申请日:2023-12-28

    Abstract: 本申请公开了一种基于多模态预训练模型的三维内容生成方法及相关组件,涉及数据处理领域,用于解决生成三维内容速度慢的问题。该方案获取用户输入的目标文本描述;基于目标文本描述及多模态预训练模型在三维内容数据库中检索,确定第一三维内容并确定对应的第三文本描述;确定目标文本描述与第三文本描述间的文本描述差异;基于文本描述差异驱动第一三维内容变形,得到目标三维内容。本申请利用多模态预训练模型在三维内容数据库中进行检索,能够更快速地确定第一三维内容,再基于目标文本描述对其进行变形,得到与目标文本描述对应的目标三维内容,相比于从零生成三维内容,能够更快地生成符合要求的目标三维内容,提高了生成的效率和速度。

    分布式集群的通信方法、系统、电子设备及可读存储介质

    公开(公告)号:CN117155929B

    公开(公告)日:2024-02-09

    申请号:CN202311423771.7

    申请日:2023-10-31

    Abstract: 本发明公开了一种分布式集群的通信方法、系统、电子设备及可读存储介质,涉及分布式集群领域,为解决受网络带宽限制使得集群间通信效率低的问题,该通信方法包括:确定分布式集群中的参数更新节点以及多个子集群;针对每一子集群,获取子集群对预设模型的多个阶段依次进行计算得到的多个梯度数据;确定获取到的各个阶段的梯度数据的发送次序;按发送次序从先到后的顺序将梯度数据发送至参数更新节点,以便通过参数更新节点基于梯度数据执行参数更新操作。本发明能够实现对集群间的网络带宽的充分利用,从而提高通信效率。

    梯度数据同步方法、模型训练方法、系统、设备及介质

    公开(公告)号:CN116955365B

    公开(公告)日:2024-02-09

    申请号:CN202311220007.X

    申请日:2023-09-21

    Abstract: 本发明公开了一种梯度数据同步方法、模型训练方法、系统、设备及介质,涉及分布式集群领域,为解决梯度同步过程中通信效率低的问题,该方法包括:获取网络模型的当前网络层的梯度数据,对梯度数据在分布式训练集群的至少一个加速器节点中进行第一阶段梯度同步对应的第一同步操作,得到当前网络层对应的第一同步结果数据;将当前网络层的第一同步结果数据存储到第一阶段梯度同步结果队列;判断是否对所有网络层的梯度数据均完成第一同步操作;若是,对第一阶段梯度同步结果队列中的第一同步结果数据在分布式训练集群的至少一个加速器节点中进行第二阶段梯度同步对应的第二同步操作。本发明能够减少加速器节点之间的通信次数,提高通信效率。

    基于多模态预训练模型的三维内容生成方法及相关组件

    公开(公告)号:CN117473105A

    公开(公告)日:2024-01-30

    申请号:CN202311827111.5

    申请日:2023-12-28

    Abstract: 本申请公开了一种基于多模态预训练模型的三维内容生成方法及相关组件,涉及数据处理领域,用于解决生成三维内容速度慢的问题。该方案获取用户输入的目标文本描述;基于目标文本描述及多模态预训练模型在三维内容数据库中检索,确定第一三维内容并确定对应的第三文本描述;确定目标文本描述与第三文本描述间的文本描述差异;基于文本描述差异驱动第一三维内容变形,得到目标三维内容。本申请利用多模态预训练模型在三维内容数据库中进行检索,能够更快速地确定第一三维内容,再基于目标文本描述对其进行变形,得到与目标文本描述对应的目标三维内容,相比于从零生成三维内容,能够更快地生成符合要求的目标三维内容,提高了生成的效率和速度。

Patent Agency Ranking