一种算子调用代码自动生成的方法、装置、介质及设备

    公开(公告)号:CN116932092A

    公开(公告)日:2023-10-24

    申请号:CN202311202669.4

    申请日:2023-09-18

    Abstract: 本说明书公开了一种算子调用代码自动生成的方法、装置、介质及设备。所述方法包括:获取后端硬件平台对应的算子库基本信息以及目标深度学习算法的计算图;根据算子库基本信息生成算子调用代码的代码头;对计算图进行解析,确定计算图中的各前端算子;针对每个前端算子,根据该前端算子与算子调用模板之间的映射关系,确定该算子对应算子调用模板的声明语句以及模板函数的调用语句;根据代码头、声明语句、调用语句以及该算子对应的配置信息,生成完整的后端算子的调用代码;根据每个后端算子的调用代码调用各后端算子,以通过各后端算子执行计算任务。

    一种算子优化方法、装置、存储介质及电子设备

    公开(公告)号:CN116663618A

    公开(公告)日:2023-08-29

    申请号:CN202310941263.1

    申请日:2023-07-28

    Abstract: 本说明书公开了一种算子优化方法、装置、存储介质及电子设备。在本说明书提供的算子优化方法中,获取目标神经网络模型,并确定目标神经网络模型的计算图;针对计算图中每个算子,确定包含该算子所有可行解的搜索空间;在搜索空间中选择若干可行解作为候选解,确定各候选解的评估值,并将评估值最高的作为待定解;确定目标硬件运行待定解的运行时间,并增加迭代次数;当运行时间小于当前最优时间或不存在当前最优时间时,将运行时间确定为当前最优时间,并将待定解确定为当前最优解;当迭代次数小于指定次数时,重新在该算子的搜索空间中选择指定数量个未被选择过的候选解;当迭代次数不小于指定次数时,将当前最优解确定为该算子的最优解。

    一种数据处理的方法、装置、存储介质以及电子设备

    公开(公告)号:CN116415103A

    公开(公告)日:2023-07-11

    申请号:CN202310681557.5

    申请日:2023-06-09

    Abstract: 本说明书公开了一种数据处理的方法、装置、存储介质以及电子设备,可以读取存储在指定设备内存的目标数据,并确定目标数据的各数据维度,可以根据目标数据的各数据维度,确定各种候选数据拆分方式,以及确定按照每种候选数据拆分方式执行目标数据的数据处理任务后的效率值,并根据每种候选数据拆分方式对应的效率值,确定目标数据拆分方式,其中,针对每种候选数据拆分方式,该候选数据拆分方式用于确定指定设备中至少部分的数据处理单元所要处理的数据的数据维度,数据处理单元可以包括:指定设备中的寄存器以及各级缓存。以按照目标数据拆分方式,对神经网络模型中的待处理数据进行数据处理,从而能够提高神经网络模型中矩阵运算的效率。

    一种散热系统的控制方法、装置、存储介质及电子设备

    公开(公告)号:CN116225192A

    公开(公告)日:2023-06-06

    申请号:CN202310509059.2

    申请日:2023-05-08

    Abstract: 本说明书公开了一种散热系统的控制方法、装置、存储介质及电子设备,本说明书实施例先根据历史上散热系统对计算集群散热时的各历史记录中确定出用于控制散热的各策略组合,针对每个策略组合,对各历史记录进行处理,确定在该策略组合下特征向量涉及的至少一个特征维度所对应的特征值范围,作为该策略组合的适用条件。根据每个策略组合的适用条件,构建模型,并通过模型输出的目标策略组合控制散热系统。在此方法中,通过对各历史记录进行分析,确定出采用每个策略组合所适用的条件。当需要控制散热系统时,将当前散热系统和计算集群的状态信息与各条件进行匹配,以确定出匹配上的条件所对应的目标策略组合,以控制散热系统。

    一种光子器件优化的方法、装置、存储介质及电子设备

    公开(公告)号:CN116108670A

    公开(公告)日:2023-05-12

    申请号:CN202310128939.5

    申请日:2023-02-02

    Abstract: 本说明书公开了一种光子器件优化的方法、装置、存储介质及电子设备。首先,初始化待优化区域中的各传导单元对应的相对介电常数。其次,对待优化区域进行光学仿真,根据待优化区域对应的仿真结果,得到各传导单元对应的更新后相对介电常数。而后,确定更新后相对介电常数位于设定相对介电常数范围内的待优化传导单元,若确定待优化传导单元的数量大于设定数量阈值,根据待优化传导单元对应的更新后相对介电常数,确定待优化传导单元对应的原始材料。然后,确定待优化区域在替换原始材料后的目标性能指标。最后,以最大化目标性能指标为优化目标,对光子器件进行优化。本方法可以降低光子器件优化过程中的计算量,提高优化效率。

    伪雅克比矩阵参数自整定的MIMO紧格式无模型控制方法

    公开(公告)号:CN114690628A

    公开(公告)日:2022-07-01

    申请号:CN202011644124.5

    申请日:2020-12-31

    Abstract: 本发明公开了一种伪雅克比矩阵参数自整定的MIMO紧格式无模型控制方法,利用系统误差集作为BP神经网络的输入,BP神经网络进行前向计算并通过输出层输出伪雅克比矩阵的惩罚因子与步长因子等MIMO紧格式无模型控制器待整定参数,采用MIMO紧格式无模型控制器的控制算法计算得到针对被控对象的控制输入向量,以系统误差函数的值最小化为目标,采用梯度下降法,并结合控制输入分别针对各个待整定参数的梯度信息集,进行系统误差反向传播计算,在线实时更新BP神经网络的隐含层权系数、输出层权系数,实现伪雅克比矩阵参数自整定。本发明提出的伪雅克比矩阵参数自整定的MIMO紧格式无模型控制方法,能有效克服控制器参数的在线整定难题,对MIMO系统具有良好控制效果。

    SISO紧格式无模型控制器基于集成学习的参数自整定方法

    公开(公告)号:CN112015083A

    公开(公告)日:2020-12-01

    申请号:CN202010559963.0

    申请日:2020-06-18

    Abstract: 本发明公开了一种SISO紧格式无模型控制器基于集成学习的参数自整定方法,所述集成学习算法包含PSO算法、BP神经网络以及循环神经网络三种个体算法。以系统误差作为集成学习算法的输入,首先进行三种个体算法对SISO紧格式无模型控制器的参数在线整定并输出三组临时整定参数,将结果分别输入到控制器中计算被控对象的控制输入,计算得到三组临时系统误差并利用softmax函数计算个体算法的权重比,将权重比与临时整定参数进行加权求和作为最终SISO紧格式无模型控制器待整定参数,实现参数自整定。本发明提出的SISO紧格式无模型控制器基于集成学习的参数自整定方法,结合不同个体算法优势,增强算法泛化性,克服控制器参数在线整定难题,对SISO系统具有良好的控制效果。

    SISO紧格式无模型控制器基于PSO-LSTM协同算法的参数自整定方法

    公开(公告)号:CN112015081A

    公开(公告)日:2020-12-01

    申请号:CN202010558464.X

    申请日:2020-06-18

    Abstract: 本发明公开了一种SISO紧格式无模型控制器基于PSO-LSTM协同算法的参数自整定方法,首先利用PSO算法优化LSTM初始权系数矩阵,然后利用系统误差数据集作为LSTM神经网络的输入,LSTM神经网络进行前向计算并通过输出层输出惩罚因子、步长因子等SISO紧格式无模型控制器待整定参数,采用SISO紧格式无模型控制器的控制算法计算得到控制输入,以系统误差函数的值最小化为目标,采用梯度下降法,并结合控制输入分别针对各个待整定参数的梯度信息,利用链式法则进行系统误差反向传播计算,在线实时更新LSTM神经网络中所有待学习的权系数,实现控制器基于PSO-LSTM协同算法的参数自整定。本发明提出的方法,能有效克服控制器参数的在线整定难题,对SISO系统具有良好的控制效果。

    一种基于硬件特征的算子调度方案自动搜索方法与系统

    公开(公告)号:CN117950645A

    公开(公告)日:2024-04-30

    申请号:CN202410339678.6

    申请日:2024-03-25

    Abstract: 本发明提供一种基于硬件特征的算子调度方案自动搜索方法与系统。该方法是通过获取算子输入数据的维度信息、目标硬件的硬件特征以及包含各存储层级的容量和硬件指令支持情况;再根据目标硬件的存储层级从高到低,递归地在每一个层级上,基于贪心策略搜索该层级可接受的最佳可行的数据搬运方案;其中各层级的数据搬运方案共同构成算子的调度方案;最后进行性能评估。基于搜索到的若干个算子调度方案,通过CodeGen技术生成目标硬件上的若干个算子实现,进而在硬件上测试选出性能最优的算子调度方案。因此,本发明的技术方案能够节省算力的情况下保证算子调度的优化。

Patent Agency Ranking