深度脉冲神经网络训练架构的能耗计算方法及相关设备

    公开(公告)号:CN119940458A

    公开(公告)日:2025-05-06

    申请号:CN202411827416.0

    申请日:2024-12-11

    Abstract: 本申请实施例提出的深度脉冲神经网络训练架构的能耗计算方法及相关设备,方法包括:首先,获取深度脉冲神经网络训练任务中脉冲卷积、膜电位梯度卷积和权重梯度中逻辑判别、浮点加和浮点乘的操作数量;其次,分别获取多个变量在深度脉冲神经网络训练架构的DRAM、SRAM和寄存器中进行读写操作的重用因子;接下来,基于操作数量、重用因子和各级存储器的单位读写能耗,计算得到任务读写能耗;然后,基于逻辑判别数量、浮点加和浮点乘累加操作对应的累加操作数量及其单位操作能耗,计算得到任务计算能耗;最后,累加任务读写能耗和任务计算能耗得到深度脉冲神经网络训练的任务能耗,可以精准地计算得到深度神经网络训练任务对应的任务能耗。

    基于在线结构剪枝的文本推理方法以及相关设备

    公开(公告)号:CN119647605A

    公开(公告)日:2025-03-18

    申请号:CN202510180806.1

    申请日:2025-02-19

    Inventor: 吴泽斌 田永鸿

    Abstract: 本申请提供了一种基于在线结构剪枝的文本推理方法以及相关设备,方法包括:在接收到文本推理任务时,获取未进行剪枝的文本推理模型,以及获取文本推理模型中多个解码层基于目标结构化剪枝算法进行剪枝时生成的掩模信息和算法参数信息;针对文本推理模型中的每个解码层,分别根据对应的掩模信息对解码层进行权重掩模处理,以及根据对应的算法参数信息对解码层进行输出补偿处理,得到目标剪枝模型;通过目标剪枝模型执行文本推理任务,得到文本推理结果,其中,本申请可以在推理时基于掩模信息和算法参数信息在线生成结构化剪枝的目标剪枝模型,无需保存结构化剪枝后的模型,能够有效降低文本推理方法的存储开销。

    寄生参数提取神经网络分布式训练方法及装置

    公开(公告)号:CN119647370A

    公开(公告)日:2025-03-18

    申请号:CN202411757059.5

    申请日:2024-11-29

    Abstract: 本申请实施例提供寄生参数提取神经网络分布式训练方法及装置,涉及集成电路技术领域。该方法在每个训练批次中利用数据推送进程获取每个处理设备的局部批次,在提高数据读取效率的同时节约内存,利用Horovod并行框架在处理设备上对寄生参数提取神经网络并行训练得到局部梯度,之后获取每个处理设备的局部BN层统计参数用来计算全局统计参数,将全局统计参数分发至每个处理设备进行BN层的数据更新,同时更新局部梯度,利用Horovod框架同步所有局部梯度确定模型更新参数,继续训练直至得到训练完成的寄生参数提取神经网络。在Horovod并行框架基础上实现跨卡批归一化同步操作,避免因局部批次过小而导致训练不收敛的情况,既能维持训练精度,又能提升训练效率。

    基于智算集群的资源分配方法、装置、设备及存储介质

    公开(公告)号:CN119537027A

    公开(公告)日:2025-02-28

    申请号:CN202411926301.7

    申请日:2024-12-25

    Abstract: 本申请实施例提供了一种基于智算集群的资源分配方法、装置、设备及存储介质。方法包括:确定智算服务节点集群处理每个任务队列关联的历史任务的平均处理时长及任务分配率;每个任务队列对应一个目标约束函数,每个目标约束函数用于在满足当前任务队列对应的任务延迟处理比例阈值下,限定平均处理时长变量、任务分配率变量以及服务节点总量变量,与当前任务队列的服务节点分配权重变量之间的函数关系;对每个任务队列的目标约束函数进行计算得到对应的目标服务节点分配权重,分配对应的服务器节点子集;按照待处理任务的最大任务延迟阈值,确定对应分配的任务队列并处理对应任务队列中的待处理任务。以此能够降低系统延时,充分利用系统资源。

    药物响应预测方法、装置、计算机设备及可读存储介质

    公开(公告)号:CN119517161A

    公开(公告)日:2025-02-25

    申请号:CN202411767921.0

    申请日:2024-11-30

    Abstract: 本申请实施例提供了一种药物响应预测方法、装置、计算机设备及可读存储介质。包括:进行基因测序得到目标细胞的多层次组学特征;将多个目标基因确定为多个图节点,任意两个目标基因之间的多种属性关联关系作为多条交互边,生成多边缘图;每个目标基因关联对应的多层次组学特征作为节点特征;针对每个图节点通过多条交互边进行消息传递,得到的相邻节点特征对每个图节点中的节点特征进行更新,对更新后的多边缘图进行特征映射,得到第一细胞特征向量;通过目标模型的全连接层对第一细胞特征向量和药物化合物的药物特征向量融合得到的第一融合向量进行预测,得到药物化合物对目标细胞的预测药物响应结果。以此,能够提高对药物响应预测的准确性。

    信息检索方法和装置、电子设备及存储介质

    公开(公告)号:CN119513334A

    公开(公告)日:2025-02-25

    申请号:CN202411549955.2

    申请日:2024-10-31

    Abstract: 本申请实施例提供了一种信息检索方法和装置、电子设备及存储介质,涉及数据处理技术领域,该方法包括:将获取得到的意图描述信息输入至预设的意图识别模型中,得到意图图谱;对所述意图描述信息进行模态特征提取处理,得到至少一种模态特征表示;对所述意图图谱进行模态特征提取处理,得到图结构特征表示;将所述模态特征表示和所述图结构特征表示输入至预训练的多模态融合模型中,得到多模态语义表示;根据所述多模态语义表示和待查询的数据库的模式信息,通过预设的大语言模型生成查询语句;根据所述查询语句对所述数据库中的数据进行检索,输出检索结果。本申请实施例能够提高信息检索结果的准确性,以及用户的使用体验。

    数据处理方法、装置、计算机设备及存储介质

    公开(公告)号:CN119476379A

    公开(公告)日:2025-02-18

    申请号:CN202411414343.2

    申请日:2024-10-10

    Abstract: 本申请实施例公开一种数据处理方法、装置、计算机设备及存储介质,神经网络处理器包括全局内存、中转缓存区和多个计算单元,通过对待更新矩阵进行分块处理得到多个待更新子矩阵,并将多个待更新子矩阵均衡分配给每个计算单元;在第一矩阵中确定出每个待更新子矩阵对应的第一子矩阵,将第一子矩阵从全局内存中搬运至每个待更新子矩阵对应的计算单元的预设缓存区;在第二矩阵中确定每个待更新子矩阵对应的第二子矩阵,将第二子矩阵从全局内存中搬运至中转缓存区;从预设缓存区中获取目标第一子矩阵,从中转缓存区中获取目标第二子矩阵;通过计算单元对每个待更新子矩阵、目标第一子矩阵和目标第二子矩阵进行通用矩阵乘运算,得到更新子矩阵。

    服务器集群的能效比调优方法、装置、设备及存储介质

    公开(公告)号:CN119473627A

    公开(公告)日:2025-02-18

    申请号:CN202411920717.8

    申请日:2024-12-25

    Abstract: 本申请实施例提供了一种服务器集群的能效比调优方法、装置、设备及存储介质,属于计算机处理技术领域。该方法包括:基于已有的能效比信息和相应的调控参数集合,构建多个处理器的调控参数与服务器集群的能效比之间分布关系的分布模型,基于分布模型构建用于评估调控参数集合质量的采集函数;在最优化采集函数的前提下,基于分布模型对已有能效比信息之外的其他调控参数集合进行采样,确定服务器集群在被采样的调控参数集合下工作时新的能效比信息;从更新后多个已有的能效比信息中确定满足预设能效比要求的目标能效比信息,并控制服务器集群在目标调控参数集合下工作。本申请能够在提高服务器集群的能效比、减少能源消耗。

    脉冲神经网络权重梯度计算方法及相关设备

    公开(公告)号:CN119358606A

    公开(公告)日:2025-01-24

    申请号:CN202411346108.6

    申请日:2024-09-25

    Abstract: 本申请提供了一种脉冲神经网络权重梯度计算方法,包括:获取目标脉冲神经网络中每个通道维度的脉冲变化信号以及每个卷积核对应的膜电位梯度变化信息;针对每个脉冲变化信号,分别在多个时钟滑窗内按照时钟周期读取对应的脉冲信号值;在当前时钟周期读取的多个脉冲信号值不均为0的情况下,读取多个膜电位梯度变化信息中的梯度变化值,将多个梯度变化值按行输入至预设的累加器阵列,并将多个脉冲信号值输入至预设的多个选择器,以通过多个选择器按列控制累加器阵列中多个累加器将梯度变化值累加至上一时钟周期的梯度累加结果上,得到当前时钟周期的多个梯度累加结果,进而得到每个卷积核的权重梯度信息,能够有效避免无效计算,提高计算效率。

    一种智能计算系统架构
    10.
    发明公开

    公开(公告)号:CN119204130A

    公开(公告)日:2024-12-27

    申请号:CN202411494384.7

    申请日:2024-10-24

    Abstract: 本申请实施例公开一种智能计算系统架构,其中,计算板中包括多个第一网络芯片、多个神经网络处理器和多个中央处理器,多个神经网络处理器和多个中央处理器通过多个第一网络芯片通信连接构成第一计算网络层;计算框包含多个计算板和多个交换板,多个计算板与多个交换板通信连接构成第二计算网络层;计算柜至少包括两个计算框;网络柜与计算柜通信连接、网络柜和存储柜通信连接构成第三计算网络层,网络柜中包括基于第三计算网络层构建的第四计算网络层,第一计算网络层、第二计算网络层、第三计算网络层和第四计算网络层构成计算网络,计算网络用于人工智能模型训练过程中的数据传输。该智能计算系统架构能够提高对人工智能模型的训练效率。

Patent Agency Ranking