一种算子优化调度模型的训练方法、装置、介质及设备

    公开(公告)号:CN116755862B

    公开(公告)日:2023-12-19

    申请号:CN202311010092.7

    申请日:2023-08-11

    Abstract: 本说明书公开了一种算子优化调度模型的训练方法、装置、介质及设备,包括:确定当前时刻作为训练样本的预先基于图像数据训练的图像分类模型中的各算子的信息,并输入待训练的算子优化调度模型,确定当前时刻待优化算子。确定对待优化算子进行优化后的待优化算子对图像数据进行图像分类时的运行下降时间。再根据信息、待优化算子以及待优化算子对图像数据进行图像分类时的运行下降时间,对待训练的算子优化调度模型进行训练,使得可以通过训练完成的算子优化调度模型确定当前时刻所需调度进行优化的算子,减少人工设计选择所需优化的算子的策略的麻烦,加快后续将待部署的图像分类模型部署到硬件上的速度。

    一种计算设备散热的方法、装置、存储介质及电子设备

    公开(公告)号:CN116661574B

    公开(公告)日:2023-12-12

    申请号:CN202310860078.X

    申请日:2023-07-13

    Abstract: 本说明书公开了一种计算设备散热的方法、装置、存储介质及电子设备,本方法通过确定各时刻的计算设备的芯片的特征以及计算设备的散热单元中冷却介质的特征确定训练样本,并获取散热单元的控制指令作为训练样本的标注,然后针对每个特征维度,根据该维度的特征对训练样本进行排序以确定该维度的样本序列,再确定标注相同且连续的各训练样本组成的待选样本组,并确定包含训练样本数量不小于预设数量的待选样本组作为目标样本组,根据各目标样本组以及各目标样本组对应的标注确定控制规则,进一步对计算设备进行散热控制。本方法通过对历史上控制指令、芯片特征以及散热单元中冷却介质的特征的学习生成控制规则,使计算设备可以

    张量卸载方法、装置、计算机设备及存储介质

    公开(公告)号:CN117130693A

    公开(公告)日:2023-11-28

    申请号:CN202311397785.6

    申请日:2023-10-26

    Abstract: 本申请涉及一种张量卸载方法、装置、计算机设备及存储介质。所述方法包括:获取张量特征信息,所述张量特征信息包括待训练模型每层的显存容量需求、计算间隔以及计算延迟信息;基于预设卸载策略和所述显存容量需求确定显存约束条件,基于所述预设卸载策略和计算间隔确定卸载时间约束条件,所述预设卸载策略包括主存卸载和重计算卸载;基于所述显存约束条件和卸载时间约束条件筛选所述预设卸载策略,确定多个候选卸载策略;基于所述计算延迟信息确定每个候选卸载策略的额外计算延迟,基于所述额外计算延迟确定目标卸载策略,并基于所述目标卸载策略卸载张量。本申请在对模型训练精度影响较小或无影响的情况下,通过张量卸载来增加显存的有效容量。

    基于多重多臂老虎机的编译时间资源动态分配方法及系统

    公开(公告)号:CN117009092A

    公开(公告)日:2023-11-07

    申请号:CN202311278281.2

    申请日:2023-10-07

    Abstract: 基于多重多臂老虎机的编译时间资源动态分配方法及系统,其方法包括:步骤1,获取待编译的深度学习模型,对模型进行计算图级别优化,并进行图切分;步骤2,分配深度学习模型整体编译时间,并对时间资源进行分块;步骤3,遍历多个计算子图或算子,对当前某个计算子图或算子采集其历史编译特征信息;步骤4,设置分配决策模型参数进行训练或更新,并对当前计算子图或算子的潜力进行预测;步骤5,采用强化学习技术选择当前最具潜力的计算子图或算子;步骤6,为最具优化潜力的计算子图或算子分配相应的时间资源,并进行自动调优,同时收集当前计算子图或算子的实时编译特征信息;步骤7,返回步骤2,重新开始下一个时间块资源的动态分配。

    一种基于深度强化学习的2.5D总体布线方法和系统

    公开(公告)号:CN116384321B

    公开(公告)日:2023-11-07

    申请号:CN202310384336.1

    申请日:2023-04-11

    Abstract: 一种基于深度强化学习的2.5D总体布线方法,包含:步骤1:压缩,将3D总体布线问题压缩为2D总体布线问题;步骤2:数据预处理,包括将多引脚线网按半周长模型升序排序,然后基于直角Steiner最小树算法做拆解,线网拆解的子网再排序。步骤3:基于深度强化学习针对步骤2获得的两引脚对数据点对点布线,获得2D的总体布线方案,若布线方案有溢出,输出拥塞信息;否则执行步骤4。步骤4:通过直角结构层分配技术基于2D的总体布线方案获得3D的总体布线方案。本发明还包括一种基于深度强化学习的2.5D总体布线系统。本发明将多层总体布线问题压缩后基于深度强化学习进行求解,再利用层分配技术获得3D总体布线方案,有效降低算力成本并提高总体布线性能。

    卷积运算的优化方法、装置及处理器

    公开(公告)号:CN116861149A

    公开(公告)日:2023-10-10

    申请号:CN202311136375.6

    申请日:2023-09-05

    Abstract: 本申请涉及一种卷积运算的优化方法、装置及处理器,处理器包括一级缓存,该方法包括:在内存中将卷积运算的输入张量重排为左矩阵,将卷积核重排为右矩阵;将所述左矩阵划分为多个加载矩阵,所述加载矩阵的尺寸基于所述一级缓存的容量确定;将所述多个加载矩阵依次从所述内存加载至所述一级缓存,与所述右矩阵执行矩阵乘计算;将所述多个加载矩阵对应的计算结果累加,得到所述卷积运算的结果,不需要增加输入张量的存储空间,解决了相关技术中存在的将卷积运算转换为矩阵乘计算过程中产生的冗余数据导致内存占用增加和内存局部性较低的问题。

    一种演示文稿生成方法及装置

    公开(公告)号:CN116579308B

    公开(公告)日:2023-10-10

    申请号:CN202310819781.6

    申请日:2023-07-06

    Abstract: 本发明公开了一种演示文稿生成方法及装置,该方法包括:获取生成演示文稿的主题,基于预先构建并训练完成的文本生成模块,得到演示文稿的二级标题和每个二级标题下的文字内容;将所述演示文稿的主题、二级标题和每个二级标题下的文字内容结构化得到若干部分,将每个部分作为一页演示文稿,对除了首页和目录页以外的其他页进行关键词提取;基于提取出的关键词,通过文本生成图像模块生成各页演示文稿对应的配图图像;把划分后的文字内容和对应页的配图图像进行自动排版,得到完整的演示文稿。

    一种面向智能计算的分布式异步规约方法和装置

    公开(公告)号:CN116542324B

    公开(公告)日:2023-10-10

    申请号:CN202310821100.X

    申请日:2023-07-06

    Abstract: 本发明提供了一种面向智能计算的分布式异步规约方法和装置,充分利用计计算集群内部的CPU和GPU异构计算资源,GPU只负责梯度计算,将参数更新和梯度规约卸载到CPU上执行。通过全局参数的训练迭代次序更新、全局参数的训练迭代次序同步、全局梯度同步这三个部分完成所有GPU之间的梯度更新和参数计算。有效提升了分布式训练中的通信和计算的并行性,提升了分布式训练的系统效率和性能。

    一种面向广域网的拥塞控制方法及装置

    公开(公告)号:CN116743660A

    公开(公告)日:2023-09-12

    申请号:CN202310903988.1

    申请日:2023-07-21

    Abstract: 本发明公开了一种面向广域网的拥塞控制方法:当交换机判定拥塞发生时,交换机获取接收缓冲区的网络包并构造拥塞通知报文;交换机直接将拥塞通知报文传递给发送方;其中,所述拥塞通知报文的目的IP地址为网络包的源IP地址,拥塞通知报文的源IP地址为网络包的目的IP地址;拥塞通知报文的目标TCP端口号为流量包的源TCP端口号,拥塞通知报文的源TCP端口号为网络包的目标TCP端口号;TCP头中拥塞窗口减小CWR和显示拥塞通知ECE同时被设置,表示该报文为拥塞通知报文;拥塞通知报文中TCP数据为拥塞状态相关信息。本发明还公开了一种面向广域网的拥塞控制装置。该方法及装置可以在广域网上传输拥塞通知报文,也可以缩短拥塞产生后的传输路径,提升拥塞控制的效果。

    一种晶圆键合方法及制造的键合晶圆、芯片和半导体器件

    公开(公告)号:CN116721911A

    公开(公告)日:2023-09-08

    申请号:CN202310777193.0

    申请日:2023-06-28

    Abstract: 本申请提供一种晶圆键合方法及制造的键合晶圆、芯片和半导体器件,该晶圆键合方法包括:提供第一晶圆,第一晶圆上具有第一介质层,第一介质层具有第一凹槽;提供第二晶圆,第二晶圆上具有第二介质层,第二介质层具有第二凹槽;在第一凹槽内形成第一导电层和第一界面改性层,在第二凹槽内形成第二导电层和第二界面改性层;对第一晶圆和第二晶圆进行键合,使第一凹槽和第二凹槽之间相对应,第一介质层和第二介质层之间相对固定,第一界面改性层和第二界面改性层之间通过在预设条件下发生冶金反应使第一晶圆和第二晶圆之间相互固定。可实现,提高晶圆间键合力学性能和电学性能,同时降低键合工艺要求。

Patent Agency Ranking