-
公开(公告)号:CN116483547A
公开(公告)日:2023-07-25
申请号:CN202310742056.3
申请日:2023-06-21
Applicant: 之江实验室
Abstract: 本申请涉及一种资源调度方法、装置、计算机设备和存储介质。所述方法包括:获取待调度的容器组;基于待调度的容器组,确定集群中与容器组匹配的目标节点;在待调度的容器组的优先级标志位为低延迟的情况下,将目标节点中的处理器资源分配至容器组中的容器,生成资源调度结果。采用本方法能够解决不同容器间资源抢占的问题。
-
公开(公告)号:CN116881618B
公开(公告)日:2024-06-04
申请号:CN202311078065.3
申请日:2023-08-25
Applicant: 之江实验室
Abstract: 本申请涉及一种通用矩阵乘计算优化方法、装置及处理器,该方法应用于处理器,处理器包括至少一个计算核心,计算核心包括算术逻辑单元、数据缓存和寄存器,包括:基于算术逻辑单元的宽度、寄存器的数量、数据缓存的容量,以及预先确定的用于构成通用矩阵乘算子内核的计算核心数量,确定通用矩阵乘算子内核的尺寸;基于算子内核的尺寸、预先确定的基本块矩阵的尺寸,以及左矩阵、右矩阵的尺寸,优化并行计算的计算核心数量;基于并行计算的计算核心数量、基本块矩阵的尺寸,以及左矩阵、右矩阵的尺寸,对数据缓存中通用矩阵乘计算区域的分块计算进行优化,解决了通用矩阵乘计算硬件资源利用率较低,数据访存开销较大的问题。
-
公开(公告)号:CN117149778B
公开(公告)日:2024-01-16
申请号:CN202311414028.5
申请日:2023-10-30
Applicant: 之江实验室
IPC: G06F16/22 , G06F16/2455
Abstract: 本申请涉及稀疏张量运算加速领域,特别是涉及一种稀疏张量运算加速方法、系统、计算机设备和存储介质,所述方法包括:读取两稀疏张量的压缩表示元数据信息,确定各稀疏张量中非零元素被标记为无效计算元素时所对应的另一个稀疏张量的起始非缩并维度索引和终止非缩并维度索引,并以键值对的形式存储在无效计算元素标记范围映射表中;对所述两稀疏张量进行自适应协同分块,得到所述两稀疏张量的预分块信息;基于所述无效计算元素标记范围映射表以及所述两稀疏张量的预分块信息,得到最终分块;将所述最终分块依次搬运至更内层缓存,直至完成计算。本发明减少运行时稀疏张量数据分块划分的重复性操作,进一步节省稀疏张量运算时间。
-
公开(公告)号:CN116861149B
公开(公告)日:2024-01-09
申请号:CN202311136375.6
申请日:2023-09-05
Applicant: 之江实验室
Abstract: 题。本申请涉及一种卷积运算的优化方法、装置及处理器,处理器包括一级缓存,该方法包括:在内存中将卷积运算的输入张量重排为左矩阵,将卷积核重排为右矩阵;将所述左矩阵划分为多个加载矩阵,所述加载矩阵的尺寸基于所述一级缓存的容量确定;将所述多个加载矩阵依次从所述内存加载至所述一级缓存,与所述右矩阵执行矩阵乘计算;将所述多个加载矩阵对应的计算结果累加,得到所述卷积运算的结果,不需要增加输入张量的存储空间,解决了相关技术中存在的将(56)对比文件孙凡.卷积神经网络加速器的实现与优化.《中国优秀硕士学位论文全文数据库 信息科技辑》.2019,第2019年卷(第1期),I138-1895.Xiandong Huang等.Evaluating FFT-basedalgorithms for strided convolutions onARMv8 architectures《.PerformanceEvaluation》.2021,1-18.
-
公开(公告)号:CN117149778A
公开(公告)日:2023-12-01
申请号:CN202311414028.5
申请日:2023-10-30
Applicant: 之江实验室
IPC: G06F16/22 , G06F16/2455
Abstract: 本申请涉及稀疏张量运算加速领域,特别是涉及一种稀疏张量运算加速方法、系统、计算机设备和存储介质,所述方法包括:读取两稀疏张量的压缩表示元数据信息,确定各稀疏张量中非零元素被标记为无效计算元素时所对应的另一个稀疏张量的起始非缩并维度索引和终止非缩并维度索引,并以键值对的形式存储在无效计算元素标记范围映射表中;对所述两稀疏张量进行自适应协同分块,得到所述两稀疏张量的预分块信息;基于所述无效计算元素标记范围映射表以及所述两稀疏张量的预分块信息,得到最终分块;将所述最终分块依次搬运至更内层缓存,直至完成计算。本发明减少运行时稀疏张量数据分块划分的重复性操作,进一步节省稀疏张量运算时间。
-
公开(公告)号:CN116991429A
公开(公告)日:2023-11-03
申请号:CN202311266395.5
申请日:2023-09-28
Applicant: 之江实验室
IPC: G06F8/41 , G06F18/214
Abstract: 本申请涉及一种计算机程序的编译调优方法、装置和存储介质,其中,该编译调优方法包括:选择样本硬件集合和样本程序集合并为每个样本程序随机生成优化序列,对每种样本程序与优化序列的组合进行编译、特征抽取以及运行,得到训练数据集,基于训练数据集对预设的多任务学习模型进行训练,得到预训练模型,基于预训练模型进行成本函数模型的初始化,得到目标成本函数模型,利用该目标成本函数模型对目标源程序进行调优,得到目标源程序的最优优化序列。通过本申请,解决了相关技术中计算机程序编译调优效率低下的问题,提高了计算机程序的编译调优效率。
-
公开(公告)号:CN116415103B
公开(公告)日:2023-09-05
申请号:CN202310681557.5
申请日:2023-06-09
Applicant: 之江实验室
IPC: G06F17/16
Abstract: 本说明书公开了一种数据处理的方法、装置、存储介质以及电子设备,可以读取存储在指定设备内存的目标数据,并确定目标数据的各数据维度,可以根据目标数据的各数据维度,确定各种候选数据拆分方式,以及确定按照每种候选数据拆分方式执行目标数据的数据处理任务后的效率值,并根据每种候选数据拆分方式对应的效率值,确定目标数据拆分方式,其中,针对每种候选数据拆分方式,该候选数据拆分方式用于确定指定设备中至少部分的数据处理单元所要处理的数据的数据维度,数据处理单元可以包括:指定设备中的寄存器以及各级缓存。以按照目标数据拆分方式,对神经网络模型中的待处理数据进行数据处理,从而能够提高神经网络模型中矩阵运算的效率。
-
公开(公告)号:CN116360790A
公开(公告)日:2023-06-30
申请号:CN202310274453.2
申请日:2023-03-15
Applicant: 之江实验室
Abstract: 本申请涉及一种基于虚拟机的代码编译方法、装置及执行方法、装置,其中,该基于虚拟机的代码编译方法包括:通过获取字节码中的代码块,判断代码块是否属于热点函数,若是,通过启发式编译对代码块进行编译获得第一代码;通过机器学习对代码块进行编译获得第二代码;对第一代码和第二代码进行性能评估,获得第三代码;将第三代码编译为本地代码;并将本地代码存储在预设寄存器中。通过本申请,解决了相关技术中存在传统的JIT编译方案通过解释执行的方式运行速度慢的问题,减少常用编译的代码块的反复执行的次数,省去了大量的调用和重新解释的过程,并且存放在寄存器中更可以提高执行速度,节省时间。
-
-
-
-
-
-
-