一种生成存内计算神经网络模型的方法、装置及介质

    公开(公告)号:CN117077726A

    公开(公告)日:2023-11-17

    申请号:CN202311344094.X

    申请日:2023-10-17

    Abstract: 本申请公开了一种生成存内计算神经网络模型的方法,首先根据待构建的神经网络模型的目标任务,根据历史执行所述目标任务的任务数据作为训练样本,以及将目标任务的执行结果作为标注,之后通过对量化可微超网络的模型结构进行初始化,确定模型各节点之间数据传递顺序的有向无环图,确定架构参数以及权重参数,依该有向无环图的顺序,通过训练样本对权重参数进行调整,然后通过调整后的权重参数配置的模型,调整架构参数,得到存内运行的神经网络模型。通过权值继承,实现了可交替优化的两种参数,分别通过有监督训练和启发式学习进行调整,使得可以更为高效的学习深度神经网络架构。

    一种量化感知训练的点云目标检测方法及装置

    公开(公告)号:CN116721399B

    公开(公告)日:2023-11-14

    申请号:CN202310925867.7

    申请日:2023-07-26

    Abstract: 本说明书公开了一种量化感知训练的点云目标检测方法及装置,可以获取训练样本,将训练样本中的点云样本数据输入到全精度网络中,得到目标检测结果,以对全精度网络进行训练,得到训练后的全精度网络,而后,将训练后的全精度网络进行模型量化,得到量化后网络,量化后网络的参数精度低于全精度网络的参数精度,而后,将训练样本输入到量化后网络中,得到量化后网络得到的目标检测结果,根据标注信息和目标检测结果,对量化后网络进行参数微调训练,得到训练后的量化后网络,最后,将训练后的量化后网络部署在无人驾驶设备中,以使无人驾驶设备通过量化后网络进行点云目标检测,从而在保证准确性的情况下提高了无人驾驶设备的点云检测效率。

    一种基于搜索的深度学习模型部署方法及装置

    公开(公告)号:CN116306856B

    公开(公告)日:2023-09-05

    申请号:CN202310557259.5

    申请日:2023-05-17

    Abstract: 本说明书公开了一种基于搜索的深度学习模型部署方法及装置,可以获取深度学习模型所对应的计算图,确定计算图中包括的算子,并确定每个算子匹配的硬件资源,而后,根据各算子匹配的硬件资源,构建搜索空间,从搜索空间中选取出目标样本,并确定目标样本对应的运行时长,以及确定目标样本对应的邻域样本,并确定邻域样本对应的运行时长,若邻域样本对应的运行时长短于目标样本的运行时长,将邻域样本作为重新确定出的目标样本,并继续确定目标样本对应的邻域样本以及对应的运行时长,直到满足预设迭代终止条件为止,按照目标样本所对应的分配方案,对深度学习模型的算子进行硬件资源的分配,以进行部署,本方法可以提高深度学习模型的计算效率。

    一种算子优化方法、装置、存储介质及电子设备

    公开(公告)号:CN116663618A

    公开(公告)日:2023-08-29

    申请号:CN202310941263.1

    申请日:2023-07-28

    Abstract: 本说明书公开了一种算子优化方法、装置、存储介质及电子设备。在本说明书提供的算子优化方法中,获取目标神经网络模型,并确定目标神经网络模型的计算图;针对计算图中每个算子,确定包含该算子所有可行解的搜索空间;在搜索空间中选择若干可行解作为候选解,确定各候选解的评估值,并将评估值最高的作为待定解;确定目标硬件运行待定解的运行时间,并增加迭代次数;当运行时间小于当前最优时间或不存在当前最优时间时,将运行时间确定为当前最优时间,并将待定解确定为当前最优解;当迭代次数小于指定次数时,重新在该算子的搜索空间中选择指定数量个未被选择过的候选解;当迭代次数不小于指定次数时,将当前最优解确定为该算子的最优解。

    一种数据处理的方法、装置、存储介质以及电子设备

    公开(公告)号:CN116415103A

    公开(公告)日:2023-07-11

    申请号:CN202310681557.5

    申请日:2023-06-09

    Abstract: 本说明书公开了一种数据处理的方法、装置、存储介质以及电子设备,可以读取存储在指定设备内存的目标数据,并确定目标数据的各数据维度,可以根据目标数据的各数据维度,确定各种候选数据拆分方式,以及确定按照每种候选数据拆分方式执行目标数据的数据处理任务后的效率值,并根据每种候选数据拆分方式对应的效率值,确定目标数据拆分方式,其中,针对每种候选数据拆分方式,该候选数据拆分方式用于确定指定设备中至少部分的数据处理单元所要处理的数据的数据维度,数据处理单元可以包括:指定设备中的寄存器以及各级缓存。以按照目标数据拆分方式,对神经网络模型中的待处理数据进行数据处理,从而能够提高神经网络模型中矩阵运算的效率。

    一种模型数据的存储方法、装置、存储介质及电子设备

    公开(公告)号:CN116185307A

    公开(公告)日:2023-05-30

    申请号:CN202310448220.X

    申请日:2023-04-24

    Abstract: 本说明书公开了一种模型数据的存储方法、装置、存储介质及电子设备。所述模型数据的存储方法包括:接收模型数据的存储请求并获取模型数据,确定所述模型数据的属性信息,根据所述属性信息,确定所述模型数据对应的存储位置,若所述存储位置位于所述AI加速器的本地存储单元,则确定与所述属性信息相匹配的压缩方式,作为目标压缩方式,通过所述目标压缩方式对所述模型数据进行压缩,并将压缩后的模型数据存储在所述本地存储单元中的所述存储位置,以及若所述存储位置位于所述AI加速器的远端存储单元,则将所述模型数据存储在所述远端存储单元中的所述存储位置。

    一种模型训练系统、模型训练任务执行方法、装置及介质

    公开(公告)号:CN119918624A

    公开(公告)日:2025-05-02

    申请号:CN202510404732.5

    申请日:2025-04-02

    Abstract: 本申请公开了一种模型训练系统、模型训练任务执行方法、装置及介质,模型训练系统中的管理集群可以获取训练集群执行模型训练任务时的实时状态数据,通过该实时状态数据,预测未来设定时间段内训练集群在执行模型训练任务时的状态,管理集群确定与训练集群中包含的各设备对应的各模拟器,并通过这些模拟器,初始化与训练集群对应的虚拟训练集群。管理集群根据预测状态,生成针对虚拟训练集群的若干执行策略,并按照这些执行策略中的至少部分执行策略,通过虚拟训练集群仿真执行该模型训练任务,得到至少部分执行策略对应的性能指标,根据得到的性能指标,确定目标策略,以按照目标策略,执行该模型训练任务,从而有效地提高整个训练集群的效率。

    一种点云数据处理方法、装置、存储介质及设备

    公开(公告)号:CN118334278B

    公开(公告)日:2024-08-27

    申请号:CN202410779806.9

    申请日:2024-06-17

    Abstract: 在本说明书提供的一种点云数据处理方法、装置、存储介质及设备中,针对三维空间的每个维度,按照该维度的坐标大小,依次针对该维度的每个网格截面,确定该网格截面中标记网格的数量,与前一网格截面中标记网格的数量之间的差值,并通过预设范围,确定该维度的划分面,进而基于确定出的各划分面,得到该三维空间的划分结果,即基于点云数据所在标记网格的分布,实现了三维空间的划分,避免了相邻点云数据所在的标记网格被划分到不同三维子空间中,从而提高了基于该划分结果下的点云数据,通过预测模型,确定目标预测结果的预测效率。

    一种用于空间探索的代理模型的在线数据选择方法

    公开(公告)号:CN117909746A

    公开(公告)日:2024-04-19

    申请号:CN202410322521.2

    申请日:2024-03-20

    Abstract: 本说明书公开了一种用于空间探索的代理模型的在线数据选择方法,可以获取训练样本集,首先确定出训练样本集中样本的实际排序结果,在每一轮迭代训练前,通过上一轮得到的代理模型对训练样本集中的各样本进行排序,得到一个排序结果,通过实际排序结果确定出子数据集A和子数据集C,以及通过另一种排序结果,确定出子数据集B。根据子数据集A、B、C,对代理模型进行每一轮训练,训练完成后的代理模型可以对给出的若干待排序数据进行排序,本方法重点考虑排序高的空间点的数据拟合能力,并提供了一种高排序点和全空间点之间权衡的可控调节机制,从而提高了空间探索准确性,且由于提高了对高排序点的预测准确性,提高了探索的空间采样效率。

Patent Agency Ranking