-
公开(公告)号:CN117009729B
公开(公告)日:2024-01-26
申请号:CN202311293166.2
申请日:2023-10-08
Abstract: 本说明书公开了一种基于softmax的数据处理方法及装置,将目标模型部署在服务器中,通过目标模型的前处理层,确定待处理数据对应的目标矩阵,并通过在服务器上运行归一化层的第一算子,确定该目标矩阵中各行数据分别对应的归一化参数,再通过在服务器上运行第二算子,确定该目标矩阵对应的全局最大值和全局指数和,进而当目标模型的后处理层启动时,通过在服务器上运行融合算子,确定目标矩阵的归一化结果,并根据该归一化结果执行该后处理层对应的数据处理任务。本方法中的服务器不需要对目标矩阵中的数据同时进行处理,即可确定出目标矩阵的全局最大值和全局指数和,减少了对服务器的算力的要求,提高了任务处理效率。
-
公开(公告)号:CN115981870B
公开(公告)日:2023-06-13
申请号:CN202310250917.6
申请日:2023-03-10
IPC: G06F9/50
Abstract: 本说明书公开了一种数据处理的方法、装置、存储介质及电子设备。该数据处理的方法包括:获取初始处理模型,并确定初始处理模型中包含的各目标模型算子,针对每个目标模型算子,根据各处理步骤对该模型算子进行拆分,得到该模型算子包含的各子模型算子,根据每个子模型算子和未被拆分的目标模型算子对应的计算顺序,将各子模型算子以及未被拆分的各目标模型算子进行融合,得到至少一个融合算子,根据各融合算子确定优化后处理模型并部署,在接收到数据处理请求后,将获取到的待处理数据输入所述优化后处理模型,以通过所述优化后处理模型对所述待处理数据进行数据处理。
-
公开(公告)号:CN114581781B
公开(公告)日:2022-08-09
申请号:CN202210480814.4
申请日:2022-05-05
Applicant: 之江实验室
Abstract: 本发明公开了一种高分辨率遥感图像的目标检测方法及装置,该方法包括:从传感器获取原始高分辨率遥感图像;从历史检测结果中获取原始高分辨率遥感图像所对应区域以及所述区域向四周扩展预定距离的扩展区域内的目标信息;根据目标信息,对原始高分辨率遥感图像进行自适应的图像分区,得到不同的簇侯检区,进而得到必检区和非必检区;进行必检区的模型选择,生成必检区的目标检测方案;执行目标检测方案,得到必检区的检测结果;判断计算平台是否有多余计算资源以检测非必检区,若有,则进行非必检区的动态分区检测,得到非必检区的检测结果,将必检区的检测结果和非必检区的检测结果合并为目标检测结果,否则将必检区的检测结果作为目标检测结果。
-
-
公开(公告)号:CN115981870A
公开(公告)日:2023-04-18
申请号:CN202310250917.6
申请日:2023-03-10
IPC: G06F9/50
Abstract: 本说明书公开了一种数据处理的方法、装置、存储介质及电子设备。该数据处理的方法包括:获取初始处理模型,并确定初始处理模型中包含的各目标模型算子,针对每个目标模型算子,根据各处理步骤对该模型算子进行拆分,得到该模型算子包含的各子模型算子,根据每个子模型算子和未被拆分的目标模型算子对应的计算顺序,将各子模型算子以及未被拆分的各目标模型算子进行融合,得到至少一个融合算子,根据各融合算子确定优化后处理模型并部署,在接收到数据处理请求后,将获取到的待处理数据输入所述优化后处理模型,以通过所述优化后处理模型对所述待处理数据进行数据处理。
-
公开(公告)号:CN119473637B
公开(公告)日:2025-05-02
申请号:CN202510064880.7
申请日:2025-01-15
Applicant: 之江实验室
IPC: G06F9/50 , G06N3/063 , G06N3/0464
Abstract: 本说明书公开了一种计算任务规划方法、装置、存储介质及电子设备,获取待计算的神经网络层的计算数据的数据尺寸,根据参与神经网络层计算的计算核的总数量,确定各计算核需承担的计算任务对应的数据尺寸,对计算核需承担的计算任务对应的数据尺寸进行划分,得到子任务数据的数据尺寸,使计算核的存储容量与进行子任务数据对应计算任务所需的存储空间之间的差值最小化。子任务数据的数据尺寸为在一个通信周期,计算核读取的数据量,因为进行子任务数据对应计算任务所需的存储空间之间的差值最小化,所以应用本说明书中的方法,能够在神经网络的计算过程中,充分利用计算核的存储容量,实现资源利用率的最大化,从而加快神经网络计算的速度。
-
公开(公告)号:CN119166948A
公开(公告)日:2024-12-20
申请号:CN202411629645.1
申请日:2024-11-15
Applicant: 之江实验室
IPC: G06F17/10 , G06N3/0499 , G06N3/084 , G06N3/063
Abstract: 本发明公开一种众核环境下自适应的dw类型算子数据分布方法和装置,通过获取参与计算的硬件设备参数以及计算任务参数,根据x和dy的形状搜索适应硬件设备参数的数据分布;根据数据分布和单次取数大小,将输入数据划分为多个块进行计算,最后根据得到的数据分布选择规约维度和连接写回维度写回。本发明能够针对计算芯片和参与计算的数据参数,自适应的搜索适应计算的数据分布,从而减少了因数据分布不合理导致的额外数据传输的开销,从而优化了算子性能。
-
公开(公告)号:CN117009729A
公开(公告)日:2023-11-07
申请号:CN202311293166.2
申请日:2023-10-08
Abstract: 本说明书公开了一种基于softmax的数据处理方法及装置,将目标模型部署在服务器中,通过目标模型的前处理层,确定待处理数据对应的目标矩阵,并通过在服务器上运行归一化层的第一算子,确定该目标矩阵中各行数据分别对应的归一化参数,再通过在服务器上运行第二算子,确定该目标矩阵对应的全局最大值和全局指数和,进而当目标模型的后处理层启动时,通过在服务器上运行融合算子,确定目标矩阵的归一化结果,并根据该归一化结果执行该后处理层对应的数据处理任务。本方法中的服务器不需要对目标矩阵中的数据同时进行处理,即可确定出目标矩阵的全局最大值和全局指数和,减少了对服务器的算力的要求,提高了任务处理效率。
-
公开(公告)号:CN116340004A
公开(公告)日:2023-06-27
申请号:CN202310429448.4
申请日:2023-04-11
Applicant: 之江实验室
Abstract: 本说明书公开了一种任务执行的方法、装置、存储介质及电子设备。所述任务执行的方法包括:获取目标模型的模型数据,针对每个计算单元,确定该计算单元在每个时间节点之前允许进行针对各微训练批次的反向传播的最大次数,并确定反向传播次数的最大值所对应的时间节点,作为前向传播节点,在至少位于所述前向传播节点之前的各时间节点中确定该计算单元执行针对每个微训练批次的反向传播的时间节点,作为反向传播节点,根据每个计算单元对应的前向传播节点以及每个计算单元对应的反向传播节点,确定针对所述目标模型的训练策略,并基于所述训练策略,执行针对所述目标模型的任务执行任务。
-
公开(公告)号:CN116185937A
公开(公告)日:2023-05-30
申请号:CN202211509617.7
申请日:2022-11-29
Applicant: 之江实验室
IPC: G06F15/173
Abstract: 一种基于众核处理器多层互联架构的二元运算访存优化方法,包括:检查第二类核间的计算任务是否存在可重用的计算数据以及需要加载的数据批次数;确定每一次计算迭代时,每个第二类核所分配的计算数据;第一轮计算时,所有第二类核的计算数据通过DMA从主存获取到第二类核LDM中;第2~N轮计算,根据访存优化的策略,计算数据通过RMA从第二类核组内其他第二类核的LDM中获取,然后进行计算;此前2个步骤重复次;第轮计算,计算数据通过DMA从主存获取到第二类核的LDM中,然后进行计算;第轮计算,计算数据通过RMA从第二类核组内其他第二类核的LDM中获取,然后进行计算;结束计算,将上一轮计算的结果通过DMA写回主存。
-
-
-
-
-
-
-
-
-