-
公开(公告)号:CN116340004A
公开(公告)日:2023-06-27
申请号:CN202310429448.4
申请日:2023-04-11
Applicant: 之江实验室
Abstract: 本说明书公开了一种任务执行的方法、装置、存储介质及电子设备。所述任务执行的方法包括:获取目标模型的模型数据,针对每个计算单元,确定该计算单元在每个时间节点之前允许进行针对各微训练批次的反向传播的最大次数,并确定反向传播次数的最大值所对应的时间节点,作为前向传播节点,在至少位于所述前向传播节点之前的各时间节点中确定该计算单元执行针对每个微训练批次的反向传播的时间节点,作为反向传播节点,根据每个计算单元对应的前向传播节点以及每个计算单元对应的反向传播节点,确定针对所述目标模型的训练策略,并基于所述训练策略,执行针对所述目标模型的任务执行任务。
-
公开(公告)号:CN116185937A
公开(公告)日:2023-05-30
申请号:CN202211509617.7
申请日:2022-11-29
Applicant: 之江实验室
IPC: G06F15/173
Abstract: 一种基于众核处理器多层互联架构的二元运算访存优化方法,包括:检查第二类核间的计算任务是否存在可重用的计算数据以及需要加载的数据批次数;确定每一次计算迭代时,每个第二类核所分配的计算数据;第一轮计算时,所有第二类核的计算数据通过DMA从主存获取到第二类核LDM中;第2~N轮计算,根据访存优化的策略,计算数据通过RMA从第二类核组内其他第二类核的LDM中获取,然后进行计算;此前2个步骤重复次;第轮计算,计算数据通过DMA从主存获取到第二类核的LDM中,然后进行计算;第轮计算,计算数据通过RMA从第二类核组内其他第二类核的LDM中获取,然后进行计算;结束计算,将上一轮计算的结果通过DMA写回主存。
-
公开(公告)号:CN116070474A
公开(公告)日:2023-05-05
申请号:CN202310363122.6
申请日:2023-04-07
Applicant: 之江实验室 , 浙江大学 , 无锡江南计算技术研究所
IPC: G06F30/20 , G06F17/15 , G06F111/04 , G06F111/08
Abstract: 本发明公开了一种面向AI浮点融合运算单元的验证激励产生方法,该方法包括:针对新型AI浮点融合运算单元进行分析,获取输入操作数数量、输入操作数数据格式、输入操作数数据类型并构建相应参数模型;结合参数模型构造输入操作数之间的约束表达式、输入操作数和中间结果的约束表达式、输入操作数和输出结果的约束表达式;分别对三种约束表达式进行求解生成一定数量的验证激励;将验证激励分别送入参考模型和待验证新型AI浮点融合运算单元中比较计算结果和记录覆盖率。通过该方法可以提高验证人员对新型AI浮点融合运算单元的验证效率和验证覆盖率。
-
公开(公告)号:CN110851255B
公开(公告)日:2022-04-15
申请号:CN201911080332.4
申请日:2019-11-07
Applicant: 之江实验室
IPC: G06F9/48 , G06N3/02 , H04N21/234 , H04N21/44
Abstract: 本发明公开一种基于终端设备和边缘服务器协同进行视频流处理的方法,所述的视频流处理划分为数据预处理、深度神经网络推理和结果处理三个阶段,终端设备的计算任务分为数据预处理TP、数据传输TD_t、神经网络推理TI、结果接收TR_r和结果处理TF,边缘服务器的计算任务分为数据接收ED_r、深度神经网络推理EI,结果传输ER_t,所述的视频预处理采用流水化方式进行任务调度,终端设备按照任务优先级,根据空闲状态执行计算任务,边缘服务器也根据任务优先级的顺序执行;其中,终端设备承担任务的优先级从高到低排序为:TR_r>TD_t>TF>TP=TI;边缘服务器承担任务的优先级从高到低排序为:ED_r>EI>ER_t。该方法在发挥边缘服务器强大算力的同时,提高了计算效率。
-
公开(公告)号:CN117873904B
公开(公告)日:2024-07-19
申请号:CN202410257192.8
申请日:2024-03-07
Abstract: 本发明公开了一种基于t‑分布鲸鱼优化算法生成浮点数测试激励方法和装置,初始化鲸鱼优化算法的参数;初始化鲸鱼种群位置;建立UVM验证平台收集功能覆盖率集合并计算适应度值;更新参数用于鲸鱼个体位置计算;进行第t次迭代,使用收缩包围机制或螺旋更新策略移动鲸鱼个体位置;位置更新,根据鲸鱼个体位置前后适应度值大小决定位置是否替换;采用t‑分布变异算子对种群个体进行扰动计算生成新种群,并更新个体位置;判断是否满足结束条件,如果达到预设的结束条件,则退出整体的算法循环;否则更新参数继续迭代直至满足结束条件。本发明采用鲸鱼优化算法来避免遍历整个搜索空间,朝尽早覆盖所有功能覆盖点的方向前进。
-
公开(公告)号:CN117933410B
公开(公告)日:2024-06-07
申请号:CN202410322527.X
申请日:2024-03-20
Applicant: 之江实验室
Abstract: 在本说明书提供的一种量子计算的纠错方法、系统、存储介质及电子设备中,先获取集成芯片中量子芯片输出的计算结果,在集成芯片中,确定与量子芯片对应的存算一体芯片中储存的CSS码的逆矩阵,再根据量子芯片的计算结果,通过CSS码,确定计算结果的症状,然后根据CSS码的逆矩阵以及计算结果的症状,确定计算结果的噪声,最后根据计算结果的噪声,对计算结果纠正,通过在低功耗的集成芯片上运行的分布式算法,高效的得到了量子芯片的正确计算结果。
-
公开(公告)号:CN117873904A
公开(公告)日:2024-04-12
申请号:CN202410257192.8
申请日:2024-03-07
Abstract: 本发明公开了一种基于t‑分布鲸鱼优化算法生成浮点数测试激励方法和装置,初始化鲸鱼优化算法的参数;初始化鲸鱼种群位置;建立UVM验证平台收集功能覆盖率集合并计算适应度值;更新参数用于鲸鱼个体位置计算;进行第t次迭代,使用收缩包围机制或螺旋更新策略移动鲸鱼个体位置;位置更新,根据鲸鱼个体位置前后适应度值大小决定位置是否替换;采用t‑分布变异算子对种群个体进行扰动计算生成新种群,并更新个体位置;判断是否满足结束条件,如果达到预设的结束条件,则退出整体的算法循环;否则更新参数继续迭代直至满足结束条件。本发明采用鲸鱼优化算法来避免遍历整个搜索空间,朝尽早覆盖所有功能覆盖点的方向前进。
-
公开(公告)号:CN117009729B
公开(公告)日:2024-01-26
申请号:CN202311293166.2
申请日:2023-10-08
Abstract: 本说明书公开了一种基于softmax的数据处理方法及装置,将目标模型部署在服务器中,通过目标模型的前处理层,确定待处理数据对应的目标矩阵,并通过在服务器上运行归一化层的第一算子,确定该目标矩阵中各行数据分别对应的归一化参数,再通过在服务器上运行第二算子,确定该目标矩阵对应的全局最大值和全局指数和,进而当目标模型的后处理层启动时,通过在服务器上运行融合算子,确定目标矩阵的归一化结果,并根据该归一化结果执行该后处理层对应的数据处理任务。本方法中的服务器不需要对目标矩阵中的数据同时进行处理,即可确定出目标矩阵的全局最大值和全局指数和,减少了对服务器的算力的要求,提高了任务处理效率。
-
公开(公告)号:CN115981870B
公开(公告)日:2023-06-13
申请号:CN202310250917.6
申请日:2023-03-10
IPC: G06F9/50
Abstract: 本说明书公开了一种数据处理的方法、装置、存储介质及电子设备。该数据处理的方法包括:获取初始处理模型,并确定初始处理模型中包含的各目标模型算子,针对每个目标模型算子,根据各处理步骤对该模型算子进行拆分,得到该模型算子包含的各子模型算子,根据每个子模型算子和未被拆分的目标模型算子对应的计算顺序,将各子模型算子以及未被拆分的各目标模型算子进行融合,得到至少一个融合算子,根据各融合算子确定优化后处理模型并部署,在接收到数据处理请求后,将获取到的待处理数据输入所述优化后处理模型,以通过所述优化后处理模型对所述待处理数据进行数据处理。
-
公开(公告)号:CN115712583B
公开(公告)日:2023-04-18
申请号:CN202310023205.0
申请日:2023-01-09
Applicant: 之江实验室 , 无锡江南计算技术研究所
IPC: G06F12/0877 , G06F12/0884 , G06F12/0862 , G06F3/06 , G06N3/08
Abstract: 本发明公开了一种提升分布式缓存跨节点访问性能的方法及装置、介质。该方法依据轮次训练时预先生成的随机序列,在一个训练步骤中需要跨节点访问训练所需的样本时,查看当前步骤以及后续步骤所需的其他样本是否也存在于目标节点中,如果存在则将其一次性读取过来。本发明减少了训练过程中跨节点访问的次数带来的性能开销,有助于提升训练的总体性能。
-
-
-
-
-
-
-
-
-