基于softmax的数据处理方法及装置

    公开(公告)号:CN117009729A

    公开(公告)日:2023-11-07

    申请号:CN202311293166.2

    申请日:2023-10-08

    Abstract: 本说明书公开了一种基于softmax的数据处理方法及装置,将目标模型部署在服务器中,通过目标模型的前处理层,确定待处理数据对应的目标矩阵,并通过在服务器上运行归一化层的第一算子,确定该目标矩阵中各行数据分别对应的归一化参数,再通过在服务器上运行第二算子,确定该目标矩阵对应的全局最大值和全局指数和,进而当目标模型的后处理层启动时,通过在服务器上运行融合算子,确定目标矩阵的归一化结果,并根据该归一化结果执行该后处理层对应的数据处理任务。本方法中的服务器不需要对目标矩阵中的数据同时进行处理,即可确定出目标矩阵的全局最大值和全局指数和,减少了对服务器的算力的要求,提高了任务处理效率。

    一种任务执行的方法、装置、存储介质及电子设备

    公开(公告)号:CN116340004A

    公开(公告)日:2023-06-27

    申请号:CN202310429448.4

    申请日:2023-04-11

    Abstract: 本说明书公开了一种任务执行的方法、装置、存储介质及电子设备。所述任务执行的方法包括:获取目标模型的模型数据,针对每个计算单元,确定该计算单元在每个时间节点之前允许进行针对各微训练批次的反向传播的最大次数,并确定反向传播次数的最大值所对应的时间节点,作为前向传播节点,在至少位于所述前向传播节点之前的各时间节点中确定该计算单元执行针对每个微训练批次的反向传播的时间节点,作为反向传播节点,根据每个计算单元对应的前向传播节点以及每个计算单元对应的反向传播节点,确定针对所述目标模型的训练策略,并基于所述训练策略,执行针对所述目标模型的任务执行任务。

    基于众核处理器多层互联架构的二元运算访存优化方法及装置

    公开(公告)号:CN116185937A

    公开(公告)日:2023-05-30

    申请号:CN202211509617.7

    申请日:2022-11-29

    Abstract: 一种基于众核处理器多层互联架构的二元运算访存优化方法,包括:检查第二类核间的计算任务是否存在可重用的计算数据以及需要加载的数据批次数;确定每一次计算迭代时,每个第二类核所分配的计算数据;第一轮计算时,所有第二类核的计算数据通过DMA从主存获取到第二类核LDM中;第2~N轮计算,根据访存优化的策略,计算数据通过RMA从第二类核组内其他第二类核的LDM中获取,然后进行计算;此前2个步骤重复次;第轮计算,计算数据通过DMA从主存获取到第二类核的LDM中,然后进行计算;第轮计算,计算数据通过RMA从第二类核组内其他第二类核的LDM中获取,然后进行计算;结束计算,将上一轮计算的结果通过DMA写回主存。

    一种数据处理的方法、装置、存储介质及电子设备

    公开(公告)号:CN115981870A

    公开(公告)日:2023-04-18

    申请号:CN202310250917.6

    申请日:2023-03-10

    Abstract: 本说明书公开了一种数据处理的方法、装置、存储介质及电子设备。该数据处理的方法包括:获取初始处理模型,并确定初始处理模型中包含的各目标模型算子,针对每个目标模型算子,根据各处理步骤对该模型算子进行拆分,得到该模型算子包含的各子模型算子,根据每个子模型算子和未被拆分的目标模型算子对应的计算顺序,将各子模型算子以及未被拆分的各目标模型算子进行融合,得到至少一个融合算子,根据各融合算子确定优化后处理模型并部署,在接收到数据处理请求后,将获取到的待处理数据输入所述优化后处理模型,以通过所述优化后处理模型对所述待处理数据进行数据处理。

    基于softmax的数据处理方法及装置

    公开(公告)号:CN117009729B

    公开(公告)日:2024-01-26

    申请号:CN202311293166.2

    申请日:2023-10-08

    Abstract: 本说明书公开了一种基于softmax的数据处理方法及装置,将目标模型部署在服务器中,通过目标模型的前处理层,确定待处理数据对应的目标矩阵,并通过在服务器上运行归一化层的第一算子,确定该目标矩阵中各行数据分别对应的归一化参数,再通过在服务器上运行第二算子,确定该目标矩阵对应的全局最大值和全局指数和,进而当目标模型的后处理层启动时,通过在服务器上运行融合算子,确定目标矩阵的归一化结果,并根据该归一化结果执行该后处理层对应的数据处理任务。本方法中的服务器不需要对目标矩阵中的数据同时进行处理,即可确定出目标矩阵的全局最大值和全局指数和,减少了对服务器的算力的要求,提高了任务处理效率。

    一种数据处理的方法、装置、存储介质及电子设备

    公开(公告)号:CN115981870B

    公开(公告)日:2023-06-13

    申请号:CN202310250917.6

    申请日:2023-03-10

    Abstract: 本说明书公开了一种数据处理的方法、装置、存储介质及电子设备。该数据处理的方法包括:获取初始处理模型,并确定初始处理模型中包含的各目标模型算子,针对每个目标模型算子,根据各处理步骤对该模型算子进行拆分,得到该模型算子包含的各子模型算子,根据每个子模型算子和未被拆分的目标模型算子对应的计算顺序,将各子模型算子以及未被拆分的各目标模型算子进行融合,得到至少一个融合算子,根据各融合算子确定优化后处理模型并部署,在接收到数据处理请求后,将获取到的待处理数据输入所述优化后处理模型,以通过所述优化后处理模型对所述待处理数据进行数据处理。

Patent Agency Ranking