一种点云数据处理方法、装置、存储介质及设备

    公开(公告)号:CN118334278A

    公开(公告)日:2024-07-12

    申请号:CN202410779806.9

    申请日:2024-06-17

    Abstract: 在本说明书提供的一种点云数据处理方法、装置、存储介质及设备中,针对三维空间的每个维度,按照该维度的坐标大小,依次针对该维度的每个网格截面,确定该网格截面中标记网格的数量,与前一网格截面中标记网格的数量之间的差值,并通过预设范围,确定该维度的划分面,进而基于确定出的各划分面,得到该三维空间的划分结果,即基于点云数据所在标记网格的分布,实现了三维空间的划分,避免了相邻点云数据所在的标记网格被划分到不同三维子空间中,从而提高了基于该划分结果下的点云数据,通过预测模型,确定目标预测结果的预测效率。

    模型训练显存优化方法、装置、电子装置和存储介质

    公开(公告)号:CN118313429A

    公开(公告)日:2024-07-09

    申请号:CN202410763197.8

    申请日:2024-06-13

    Abstract: 本申请涉及一种模型训练显存优化方法、装置、电子装置和存储介质,其中,该模型训练显存优化方法包括:获取模型原始参数,将模型原始参数进行备份,得到备份参数;根据模型结构确定候选暂退的模型连接;对候选暂退的模型连接不分配显存,并为除候选暂退的模型连接之外的其他模型连接分配显存;执行循环训练过程直至达到预设的训练终止条件,得到目标训练模型;循环训练过程包括:根据预设的暂退比例,对候选暂退的模型连接进行随机暂退后,得到目标连接;根据目标连接,从备份参数中复制参数进行半精度训练,得到半精度参数梯度;根据半精度参数梯度更新备份参数,提高了模型训练中显存的利用率和训练速度。

    一种基于硬件特征的算子调度方案自动搜索方法与系统

    公开(公告)号:CN117950645A

    公开(公告)日:2024-04-30

    申请号:CN202410339678.6

    申请日:2024-03-25

    Abstract: 本发明提供一种基于硬件特征的算子调度方案自动搜索方法与系统。该方法是通过获取算子输入数据的维度信息、目标硬件的硬件特征以及包含各存储层级的容量和硬件指令支持情况;再根据目标硬件的存储层级从高到低,递归地在每一个层级上,基于贪心策略搜索该层级可接受的最佳可行的数据搬运方案;其中各层级的数据搬运方案共同构成算子的调度方案;最后进行性能评估。基于搜索到的若干个算子调度方案,通过CodeGen技术生成目标硬件上的若干个算子实现,进而在硬件上测试选出性能最优的算子调度方案。因此,本发明的技术方案能够节省算力的情况下保证算子调度的优化。

    一种算子优化方法、装置、存储介质及电子设备

    公开(公告)号:CN116663618B

    公开(公告)日:2023-12-05

    申请号:CN202310941263.1

    申请日:2023-07-28

    Abstract: 本说明书公开了一种算子优化方法、装置、存储介质及电子设备。在本说明书提供的算子优化方法中,获取目标神经网络模型,并确定目标神经网络模型的计算图;针对计算图中每个算子,确定包含该算子所有可行解的搜索空间;在搜索空间中选择若干可行解作为候选解,确定各候选解的评估值,并将评估值最高的作为待定解;确定目标硬件运行待定解的运行时间,并增加迭代次数;当运行时间小于当前最优时间或不存在当前最优时间时,将运行时间确定为当前最优时间,并将待定解确定为当前最优解;当迭代次数小于指定次数时,重新在该算子的搜索空间中选择指定数量个未被选择过的候选解;当迭代次数不小于指定次数时,将当前最优解确定为该

    面向芯粒集成设计的图神经网络温度场预测方法和装置

    公开(公告)号:CN117034721A

    公开(公告)日:2023-11-10

    申请号:CN202311289898.4

    申请日:2023-10-08

    Abstract: 本发明公开了一种面向芯粒集成设计的图神经网络温度场预测方法和装置,包含:根据有限元网格划分,将网格单元视为图数据的节点,相邻的两个网格单元用边连接,获得由节点和边组成的封装结构的图数据;根据网格单元顶点位置信息、材料属性、仿真问题的初值条件和边值条件,获得节点的初始编码;设计深度图神经网络模型,首先获得节点和边在高维空间的投射,然后让节点聚合边的信息,边聚合节点的信息,最后将节点信息解码为温度数值;根据物理方程设计损失函数并训练模型;用训练好的模型进行温度分布预测;最后将网格单元的温度用插值方法计算每个顶点的温度。

    一种模型训练和编译器自动调优的方法、装置及设备

    公开(公告)号:CN116860259A

    公开(公告)日:2023-10-10

    申请号:CN202311138278.0

    申请日:2023-09-05

    Abstract: 本说明书公开了一种模型训练和编译器自动调优的方法、装置及设备。所述模型训练的方法包括:获取目标程序,并确定编译器对该目标程序进行编译时的各优化序列;确定出初始优化序列并生成当前样本点,以及,确定初始优化序列对所述目标程序进行编译的第一运行时间;生成邻域样本点,并确定邻域样本点对目标程序进行编译的第二运行时间;判断第一运行时间是否大于第二运行时间,若是,将邻域样本点作为当前样本点;在达到指定迭代次数后,确定运行时间小于预设时间的若干个各候选优化序列,并根据各候选优化序列构建训练样本;通过构建的训练样本对预测模型进行训练。

    一种模型训练的方法以及任务执行方法及装置

    公开(公告)号:CN116777010A

    公开(公告)日:2023-09-19

    申请号:CN202311080508.2

    申请日:2023-08-25

    Abstract: 本说明书公开了一种模型训练的方法以及任务执行方法及装置,可以将获取到的在指定空间中混合物态在第一时刻下的各物理场数据输入到预测模型中,来训练该预测模型,这样一来,在将训练后的预测模型应用到实际任务执行的过程中时,相比于现有技术并不需要耗费过多的时间来一步步推导出下一时刻的指定空间中混合物态在第二时刻下的各物理场数据,这样不仅提高了预测物理场数据的效率,而且由于在训练阶段,是以混合物态在第一时刻和第二时刻前后之间的质量分布符合质量约束为条件,对预测模型进行训练,所以可以保证预测模型在实际应用中所预测出的物理场数据的准确性。

    一种模型构建方法、装置、存储介质及电子设备

    公开(公告)号:CN116502679B

    公开(公告)日:2023-09-05

    申请号:CN202310543696.1

    申请日:2023-05-15

    Abstract: 本说明书公开了一种模型构建方法、装置、存储介质及电子设备,可以对需要进行测试的各候选模型架构进行筛选,以筛选出通过代理模型预测出的性能参数的准确率较低的部分候选模型架构,来通过部署测试模型的方式获得该候选模型架构的真实性能参数,而针对剩余的候选模型架构,可以直接通过代理模型来获取出性能参数,并且可以通过主动学习的方法,在线对代理模型进行训练,从而可以在保证候选模型架构的性能评估准确率的同时,提升自动化构建深度学习模型的效率。

    一种模型数据的存储方法、装置、存储介质及电子设备

    公开(公告)号:CN116185307B

    公开(公告)日:2023-07-04

    申请号:CN202310448220.X

    申请日:2023-04-24

    Abstract: 本说明书公开了一种模型数据的存储方法、装置、存储介质及电子设备。所述模型数据的存储方法包括:接收模型数据的存储请求并获取模型数据,确定所述模型数据的属性信息,根据所述属性信息,确定所述模型数据对应的存储位置,若所述存储位置位于所述AI加速器的本地存储单元,则确定与所述属性信息相匹配的压缩方式,作为目标压缩方式,通过所述目标压缩方式对所述模型数据进行压缩,并将压缩后的模型数据存储在所述本地存储单元中的所述存储位置,以及若所述存储位置位于所述AI加速器的远端存储单元,则将所述模型数据存储在所述远端存储单元中的所述存储位置。

Patent Agency Ranking