一种计算设备散热的方法、装置、存储介质及电子设备

    公开(公告)号:CN116661574B

    公开(公告)日:2023-12-12

    申请号:CN202310860078.X

    申请日:2023-07-13

    Abstract: 本说明书公开了一种计算设备散热的方法、装置、存储介质及电子设备,本方法通过确定各时刻的计算设备的芯片的特征以及计算设备的散热单元中冷却介质的特征确定训练样本,并获取散热单元的控制指令作为训练样本的标注,然后针对每个特征维度,根据该维度的特征对训练样本进行排序以确定该维度的样本序列,再确定标注相同且连续的各训练样本组成的待选样本组,并确定包含训练样本数量不小于预设数量的待选样本组作为目标样本组,根据各目标样本组以及各目标样本组对应的标注确定控制规则,进一步对计算设备进行散热控制。本方法通过对历史上控制指令、芯片特征以及散热单元中冷却介质的特征的学习生成控制规则,使计算设备可以

    一种基于深度强化学习的2.5D总体布线方法和系统

    公开(公告)号:CN116384321B

    公开(公告)日:2023-11-07

    申请号:CN202310384336.1

    申请日:2023-04-11

    Abstract: 一种基于深度强化学习的2.5D总体布线方法,包含:步骤1:压缩,将3D总体布线问题压缩为2D总体布线问题;步骤2:数据预处理,包括将多引脚线网按半周长模型升序排序,然后基于直角Steiner最小树算法做拆解,线网拆解的子网再排序。步骤3:基于深度强化学习针对步骤2获得的两引脚对数据点对点布线,获得2D的总体布线方案,若布线方案有溢出,输出拥塞信息;否则执行步骤4。步骤4:通过直角结构层分配技术基于2D的总体布线方案获得3D的总体布线方案。本发明还包括一种基于深度强化学习的2.5D总体布线系统。本发明将多层总体布线问题压缩后基于深度强化学习进行求解,再利用层分配技术获得3D总体布线方案,有效降低算力成本并提高总体布线性能。

    卷积运算的优化方法、装置及处理器

    公开(公告)号:CN116861149A

    公开(公告)日:2023-10-10

    申请号:CN202311136375.6

    申请日:2023-09-05

    Abstract: 本申请涉及一种卷积运算的优化方法、装置及处理器,处理器包括一级缓存,该方法包括:在内存中将卷积运算的输入张量重排为左矩阵,将卷积核重排为右矩阵;将所述左矩阵划分为多个加载矩阵,所述加载矩阵的尺寸基于所述一级缓存的容量确定;将所述多个加载矩阵依次从所述内存加载至所述一级缓存,与所述右矩阵执行矩阵乘计算;将所述多个加载矩阵对应的计算结果累加,得到所述卷积运算的结果,不需要增加输入张量的存储空间,解决了相关技术中存在的将卷积运算转换为矩阵乘计算过程中产生的冗余数据导致内存占用增加和内存局部性较低的问题。

    一种生成非对称光分束器波导结构的方法、装置及设备

    公开(公告)号:CN116520567B

    公开(公告)日:2023-09-29

    申请号:CN202310749494.2

    申请日:2023-06-25

    Abstract: 本说明书提供的一种生成非对称光分束器波导结构的方法、装置及设备中,将光分束器的待确定波导结构的区域划分为若干个单元,通过光学仿真确定各单元参数的梯度,根据所述梯度更新各单元的参数,再通过光学仿真确定更新参数后所述输出光源端口的第一透光率,根据所述第一透光率确定所述区域的当前分光比,当所述当前分光比满足预设结束条件时,根据所述各单元更新后的参数,确定所述区域的波导结构。从上述方法可以看出,相比基于人工经验确定光分束器的波导结构,实现了自动确定满足目标分光比时各单元对应的参数,并根据该参数确定各单元处对应的材料,大大提高了确定波导结构的效率。

    一种生成非对称光分束器波导结构的方法、装置及设备

    公开(公告)号:CN116520567A

    公开(公告)日:2023-08-01

    申请号:CN202310749494.2

    申请日:2023-06-25

    Abstract: 本说明书提供的一种生成非对称光分束器波导结构的方法、装置及设备中,将光分束器的待确定波导结构的区域划分为若干个单元,通过光学仿真确定各单元参数的梯度,根据所述梯度更新各单元的参数,再通过光学仿真确定更新参数后所述输出光源端口的第一透光率,根据所述第一透光率确定所述区域的当前分光比,当所述当前分光比满足预设结束条件时,根据所述各单元更新后的参数,确定所述区域的波导结构。从上述方法可以看出,相比基于人工经验确定光分束器的波导结构,实现了自动确定满足目标分光比时各单元对应的参数,并根据该参数确定各单元处对应的材料,大大提高了确定波导结构的效率。

    一种基于Benes网络的开关单元校准方法

    公开(公告)号:CN115987387A

    公开(公告)日:2023-04-18

    申请号:CN202211558987.X

    申请日:2022-12-06

    Abstract: 本发明提出一种基于Benes网络的开关单元校准方法,包括以下步骤:选择网络中间级的开关单元,根据开关单元选择一条从输入到输出端口的路由,扫描被测单元的电压,获得被测单元的最佳工作电压;再从最外级开关单元开始依次向中间级校准全部开关单元,其方法是将影响测试开关串扰路的其他开关设置成偏离该串扰路的状态,使得进入串扰路的光功率最小,从而近似忽略串扰光功率的影响,扫描得到被测单元最佳工作电压。由于Benes网络的对称特性,左右两侧开关等价。本发明的开关单元校准方法无需在网络中设置监测点,极大的降低了大规模集成开关阵列的封装难度,且本发明可匹配自动测试方案,为后续更大规模的光交换芯片制作与测试提供支撑。

    一种基于硬件特征的算子调度方案自动搜索方法与系统

    公开(公告)号:CN117950645B

    公开(公告)日:2024-08-02

    申请号:CN202410339678.6

    申请日:2024-03-25

    Abstract: 本发明提供一种基于硬件特征的算子调度方案自动搜索方法与系统。该方法是通过获取算子输入数据的维度信息、目标硬件的硬件特征以及包含各存储层级的容量和硬件指令支持情况;再根据目标硬件的存储层级从高到低,递归地在每一个层级上,基于贪心策略搜索该层级可接受的最佳可行的数据搬运方案;其中各层级的数据搬运方案共同构成算子的调度方案;最后进行性能评估。基于搜索到的若干个算子调度方案,通过CodeGen技术生成目标硬件上的若干个算子实现,进而在硬件上测试选出性能最优的算子调度方案。因此,本发明的技术方案能够节省算力的情况下保证算子调度的优化。

    一种高性能算子选择的动态决策方法及装置

    公开(公告)号:CN117171577B

    公开(公告)日:2024-03-22

    申请号:CN202311450171.X

    申请日:2023-11-02

    Abstract: 本说明书公开了一种高性能算子选择的动态决策方法及装置,包括:在选择模型中特定算子应该由算子库中具体的哪一个算子实现时,需要定位到模型中特定算子的shape特征的特征区间下,并确定该特征区间下的性能排序子表是否被更新过,若是,则可以直接通过该特征区间下更新好的性能排序子表选取出目标算子,若还未更新,则在模型训练阶段可以在每一轮训练时选取不同的算子在模型中进行训练,从而得到算子的性能分数,对性能排序子表进行更新,那么在后续训练这个模型(或者其他模型中需要相同特征区间下的shape特征的算子)时,可以直接使用该性能排序子表选取出合适的算子,从而相比于现有技术能够更加准确的选择出性能良好的算子。

Patent Agency Ranking