一种模型训练能耗计算方法、装置、系统及可读存储介质

    公开(公告)号:CN115495702A

    公开(公告)日:2022-12-20

    申请号:CN202211430795.0

    申请日:2022-11-16

    Abstract: 本申请涉及模型训练技术领域,公开了一种模型训练能耗计算方法、装置、系统及可读存储介质,方法包括:获取用于进行模型训练的服务器中参与模型训练的各类设备的个数,并获取服务器对应的碳电信息;采集模型训练的过程中各类设备的运行参数;根据各类设备的个数、各类设备的运行参数及碳电信息,计算模型训练对应的能耗数据。本申请公开的技术方案,通过获取用于进行模型训练的服务器中参与模型训练的各类设备的个数、服务器对应的碳电信息,采集模型训练的过程中各类设备的运行参数,根据各类设备的个数、各类设备的运行参数及碳电信息,实现快速、有效地计算模型训练对应的能耗数据,以为模型训练以及大规模计算产生的能耗评估提供技术参考。

    一种异构互联系统及集群
    82.
    发明公开

    公开(公告)号:CN114968895A

    公开(公告)日:2022-08-30

    申请号:CN202210599488.9

    申请日:2022-05-30

    Abstract: 本申请公开了计算机技术领域内的一种异构互联系统及集群。在本申请中,每个机柜包括两个交换机和至少一个服务器,每个服务器中的各CPU通过CXL协议连接至少一个计算设备的CXL接口;每个服务器中的各CPU通过QPI/UPI互连。在一个机柜中,一个交换机连接当前机柜中各服务器的网卡并对接公网,可使当前机柜接入公网;另一交换机连接当前机柜中的各计算设备的RDMA接口,可使各计算设备实现RDMA数据直取。连接同一服务器的各计算设备还通过自身的Cable接口连接当前服务器对应的数据交换设备,可使一个服务器中的各计算设备通过Cable接口所连接的数据交换设备进行交互,保障了数据传输效率,提升了系统容错率。本申请提供的一种异构互联集群,也同样具有上述技术效果。

    一种数据同步方法、装置、设备及存储介质

    公开(公告)号:CN114884908A

    公开(公告)日:2022-08-09

    申请号:CN202210468218.4

    申请日:2022-04-29

    Abstract: 本申请涉及模型训练技术领域,公开了一种数据同步方法、装置、设备及存储介质,包括:在相同种类的加速设备之间构建一级物理拓扑,在不同种类的加速设备之间构建二级物理拓扑;二级物理拓扑中各加速设备通过缓存一致性协议连接;按照一级物理拓扑通过scatter_reduce通信方式对加速设备中的待同步数据进行第一处理,按照二级物理对加速设备中第一处理后的数据进行第二处理;按照二级物理拓扑通过all_gather通信方式对加速设备中第二处理后的数据进行第三处理,并按照一级物理拓扑对加速设备中的第三处理后的数据进行第四处理。能够实现基于多种异构加速设备进行深度学习数据并行,提高硬件资源利用率和数据通信效率。

    一种图像特征提取方法、装置及电子设备和存储介质

    公开(公告)号:CN110889439B

    公开(公告)日:2022-06-17

    申请号:CN201911088673.6

    申请日:2019-11-08

    Inventor: 王丽 曹芳 郭振华

    Abstract: 本申请公开了一种图像特征提取方法、装置及一种电子设备和计算机可读存储介质,该方法包括:根据训练集的数据大小和目标网络模型中每个网络层的参数计算每个所述网络层的数据计算量;根据GPU和FPGA的基本信息分别计算所述GPU的第一算力和所述FPGA的第二算力;基于每个所述网络层的数据计算量、所述第一算力和第二算力将每个所述网络层分配至所述GPU或所述FPGA中进行计算,得到训练完成的目标网络模型;利用所述训练完成的目标网络模型进行图像特征提取。本申请提供的图像特征提取方法在训练网络模型是采用GPU与FPGA的混合架构,能够提高网络层计算的资源利用率以及网络模型训练的能效比,进而提高图像特征提取效率。

    一种任务负载调度方法、装置、设备及可读存储介质

    公开(公告)号:CN111880911A

    公开(公告)日:2020-11-03

    申请号:CN202010568709.7

    申请日:2020-06-19

    Abstract: 本发明公开了一种任务负载调度方法,该方法包括以下步骤:对接收到的任务负载调度请求进行解析,得到待调度的目标任务;将目标任务发送到混合异构分布式计算系统中;其中,混合异构分布式计算系统包括多个不同计算架构的计算设备;利用混合异构分布式计算系统根据预建立的设备拓扑结构图对目标任务进行负载调度处理。应用本发明实施例所提供的技术方案,满足了多模态人工智能算法模型的计算要求,实现了不同计算架构的计算设备间的高效计算协同,提升了混合异构分布式计算系统的整体性能。本发明还公开了一种任务负载调度装置、设备及存储介质,具有相应技术效果。

    一种图像数据处理方法、系统、电子设备及存储介质

    公开(公告)号:CN110689475A

    公开(公告)日:2020-01-14

    申请号:CN201910853884.8

    申请日:2019-09-10

    Inventor: 王丽 曹芳 郭振华

    Abstract: 本申请公开了一种图像数据处理方法,所述图像数据处理方法包括从FPGA的全局内存中加载预设数量行的待处理图像数据至本地内存;其中,所述FPGA为采用OpenCL标准的芯片;按照池化层窗口尺寸将所述待处理图像数据划分为多个区域数据;控制所述FPGA对所有所述区域数据并行执行最大池化操作得到图像数据处理结果;其中,所述最大池化操作包括前向传播操作和反向传播操作。本申请能够提高最大池化操作的处理效率。本申请还公开了一种图像数据处理系统、一种存储介质及一种电子设备,具有以上有益效果。

    异构计算系统的检查点部署方法、系统、产品以及装置

    公开(公告)号:CN119226092A

    公开(公告)日:2024-12-31

    申请号:CN202411732114.5

    申请日:2024-11-29

    Abstract: 本发明公开了一种异构计算系统的检查点部署方法、系统、产品以及装置,涉及计算机技术领域。根据各异构算力设备的需求参数计算在每个存储设备上部署检查点时各存储设备对应的故障恢复耗时期望值,以权衡各异构算力设备的各需求参数对应检查点恢复的影响。根据各异构算力设备的需求参数和故障恢复耗时期望值确定初步的第一检查点部署关系,以实现在部署过程中针对于各异构算力设备的特性参数对应部署检查点到各个存储设备的局部最优选择的可预测性。根据初步的第一检查点部署关系,通过各异构算力设备的部署位置进行优化确定第二检查点部署关系,有效跳出局部最优解增加找到全局最优解的可能性,提高训练任务的执行效率。

    一种基于内存扩展系统的高维向量检索方法、系统、装置

    公开(公告)号:CN118152141B

    公开(公告)日:2024-08-06

    申请号:CN202410552711.3

    申请日:2024-05-07

    Abstract: 本发明公开了一种基于内存扩展系统的高维向量检索方法、系统、装置,涉及数据处理领域,为解决现有高维向量检索方案内存压力大、检索效率低的问题,该方法包括获取多个高维向量对应的向量数据及图数据;将多个高维向量对应的图数据写入主机内存,对每一高维向量对应的向量数据进行切片得到n份子数据,将n份子数据一一对应地写入n个设备内存中;在多个高维向量中确定查询向量以及多个当前候选向量;基于所有加速器设备计算的子距离得到每一当前候选向量和查询向量之间的总距离,将总距离最小的当前候选向量确定为查询向量的相似向量。本发明能够在降低大规模数据集造成的主机内存的压力的同时,保证检索精度,提高检索效率。

    一种基于内存扩展系统的高维向量检索方法、系统、装置

    公开(公告)号:CN118152141A

    公开(公告)日:2024-06-07

    申请号:CN202410552711.3

    申请日:2024-05-07

    Abstract: 本发明公开了一种基于内存扩展系统的高维向量检索方法、系统、装置,涉及数据处理领域,为解决现有高维向量检索方案内存压力大、检索效率低的问题,该方法包括获取多个高维向量对应的向量数据及图数据;将多个高维向量对应的图数据写入主机内存,对每一高维向量对应的向量数据进行切片得到n份子数据,将n份子数据一一对应地写入n个设备内存中;在多个高维向量中确定查询向量以及多个当前候选向量;基于所有加速器设备计算的子距离得到每一当前候选向量和查询向量之间的总距离,将总距离最小的当前候选向量确定为查询向量的相似向量。本发明能够在降低大规模数据集造成的主机内存的压力的同时,保证检索精度,提高检索效率。

    异构计算平台及其任务仿真与耗时预测方法、装置、设备

    公开(公告)号:CN117971630A

    公开(公告)日:2024-05-03

    申请号:CN202410382408.3

    申请日:2024-04-01

    Abstract: 本发明公开了一种异构计算平台及其任务仿真与耗时预测方法、装置、设备,应用于异构计算领域。其中,方法包括获取异构计算平台采用层间并行方式执行目标任务的任务配置信息;调用预先构建的子任务训练耗时确定模型,根据任务配置信息中的目标任务特征确定各目标算力的子任务训练耗时信息。根据各目标算力的子任务训练耗时信息、任务配置信息中各子任务对应的目标算力及相应处理顺序,对采用层间并行方式执行目标任务的过程进行仿真,最后根据仿真结果确定目标任务的训练耗时预测结果。本发明可以解决相关技术并行训练任务的训练耗时无法精准预测的问题,能够实现精准预测层间并行训练任务的训练耗时。

Patent Agency Ranking