-
公开(公告)号:CN118694765B
公开(公告)日:2024-12-27
申请号:CN202411187773.5
申请日:2024-08-28
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: H04L67/1001 , G06F18/214
Abstract: 本发明公开了一种数据传输方法、装置、设备及计算机可读存储介质,涉及计算机应用技术领域,包括:利用发送端智能网卡接收浮点型模型训练数据集,并进行量化操作,分别对得到的各量化后模型训练数据进行损失度计算;利用发送端智能网卡将损失度计算结果满足预设损失度允许范围的量化后模型训练数据发送给接收端智能网卡,并将损失度计算结果超出预设损失度允许范围的量化后模型训练数据对应的浮点型模型训练数据发送给接收端智能网卡;利用接收端智能网卡对量化后模型训练数据进行反量化,将各浮点型模型训练数据均上传至接收端。本发明解决了数据量化速度慢,数据传输耗时长等问题,较大地提高了数据量化速度,降低了传输耗时。
-
公开(公告)号:CN118674731B
公开(公告)日:2024-12-03
申请号:CN202411132770.1
申请日:2024-08-19
Applicant: 浪潮(北京)电子信息产业有限公司
Abstract: 本申请公开了一种图像分割方法、设备、程序产品及介质,涉及计算机视觉技术领域。该方法包括:构建基于预设卷积神经网络的基础图像分割模型;利用多尺度卷积操作对用于进行图像分割的数据集进行特征提取,以得到不同尺度的特征;基于预设深度学习模型架构构建线性注意力机制并利用高斯误差线性单元激活函数作为所述线性注意力机制的构造函数,将所述特征通过所述线性注意力机制进行特征融合,以得到多尺度融合特征图;对所述多尺度融合特征图进行上采样与拼接操作,并为所述基础图像分割模型配置相应的损失函数与优化器以得到目标图像分割模型,以便利用所述目标图像分割模型进行图像分割。通过本申请的技术方案,可以显著提升整体图像分割性能。
-
公开(公告)号:CN118694765A
公开(公告)日:2024-09-24
申请号:CN202411187773.5
申请日:2024-08-28
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: H04L67/1001 , G06F18/214
Abstract: 本发明公开了一种数据传输方法、装置、设备及计算机可读存储介质,涉及计算机应用技术领域,包括:利用发送端智能网卡接收浮点型模型训练数据集,并进行量化操作,分别对得到的各量化后模型训练数据进行损失度计算;利用发送端智能网卡将损失度计算结果满足预设损失度允许范围的量化后模型训练数据发送给接收端智能网卡,并将损失度计算结果超出预设损失度允许范围的量化后模型训练数据对应的浮点型模型训练数据发送给接收端智能网卡;利用接收端智能网卡对量化后模型训练数据进行反量化,将各浮点型模型训练数据均上传至接收端。本发明解决了数据量化速度慢,数据传输耗时长等问题,较大地提高了数据量化速度,降低了传输耗时。
-
公开(公告)号:CN118567864B
公开(公告)日:2024-10-25
申请号:CN202411010568.1
申请日:2024-07-26
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06F9/50 , G06F9/48 , H04L45/12 , H04L45/74 , H04L45/00 , H04L45/44 , H04L67/10 , G06N3/045 , G06N3/092
Abstract: 本发明公开了一种算力调度方法、系统、装置、产品及存储介质,涉及分布式系统领域,为解决频繁信息采集导致算力调度系统整体资源利用率低的问题,该方法包括获取算力调度系统中的当前算力资源信息;在未接收到计算任务对应的第一触发信号时,基于当前算力资源信息判断算力调度系统中的计算任务是否满足动态调度条件,若是,执行当前次动态调度计算操作;在接收到第一触发信号时,执行当前次动态调度计算操作;其中,动态调度计算操作包括:基于当前算力资源信息确定计算任务对应的当前最优计算节点、当前最短转发路径以及当前最长执行时间。本发明能够降低对整个算力调度系统的计算资源和网络传输的占用,从而提高算力调度系统的资源利用率。
-
公开(公告)号:CN118567864A
公开(公告)日:2024-08-30
申请号:CN202411010568.1
申请日:2024-07-26
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06F9/50 , G06F9/48 , H04L45/12 , H04L45/74 , H04L45/00 , H04L45/44 , H04L67/10 , G06N3/045 , G06N3/092
Abstract: 本发明公开了一种算力调度方法、系统、节点、产品及存储介质,涉及分布式系统领域,为解决频繁信息采集导致算力调度系统整体资源利用率低的问题,该方法包括获取算力调度系统中的当前算力资源信息;在未接收到计算任务对应的第一触发信号时,基于当前算力资源信息判断算力调度系统中的计算任务是否满足动态调度条件,若是,执行当前次动态调度计算操作;在接收到第一触发信号时,执行当前次动态调度计算操作;其中,动态调度计算操作包括:基于当前算力资源信息确定计算任务对应的当前最优计算节点、当前最短转发路径以及当前最长执行时间。本发明能够降低对整个算力调度系统的计算资源和网络传输的占用,从而提高算力调度系统的资源利用率。
-
公开(公告)号:CN118550710A
公开(公告)日:2024-08-27
申请号:CN202411010565.8
申请日:2024-07-26
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06F9/50 , G06F9/48 , H04L45/028 , H04L67/1025
Abstract: 本发明公开了一种算力路由方法、设备、系统、产品及可读存储介质,涉及算力调度领域,为解决静态规则路由无法适应动态的环境变化的问题,该算力路由方法包括获取第一算力资源信息和待处理计算任务的任务特性信息;根据所述任务特性信息和所述第一算力资源信息获取将所述待处理计算任务转发到各个邻域节点的概率分布;在所述概率分布中进行采样得到目标转发节点,将所述任务特性信息转发到所述目标转发节点。本发明能够适应算力调度系统中的动态环境变化,提高算力调度系统的资源利用率和安全性,优化算力调度系统的性能。
-
公开(公告)号:CN118227343A
公开(公告)日:2024-06-21
申请号:CN202410658894.7
申请日:2024-05-27
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06F9/50 , H04L67/1008 , H04L67/101 , H04L67/1097
Abstract: 本发明公开了一种数据处理方法、系统、装置、设备、介质及产品,涉及通信技术领域。负载的计算资源(硬件加速器)由开放性互联协议单独传输至DPU,无需仅通过CPU和网卡这样的传输途径,这样计算资源和存储资源各自占用一条传输途径,使得CPU的带宽利用率提高,同时为其他存储资源的负载提供更多的带宽利用,也节省CPU的计算资源。另外,基于开放式互联协议进行数据传输,在DPU内获取信息的带宽和时延显著提升。同时,硬件加速器和CPU各自的传输途径,使得不支持开放式互联协议的部件依旧可以采用原有的CPU进行通信传输,进而保证足够的设备兼容性。
-
公开(公告)号:CN117648264A
公开(公告)日:2024-03-05
申请号:CN202311616379.4
申请日:2023-11-29
Applicant: 浪潮(北京)电子信息产业有限公司
Abstract: 本发明公开了一种网卡设备及数据传输系统,涉及数据处理领域,为解决数据传输占用主机内存的访问带宽的问题,该网卡设备包括存储模块;描述符队列地址寄存器;计算高速链路硬核模块,用于将主机发送的数据传输至第一数据存储区域,将主机发送的描述符传输至第一描述符存储区域,将主机发送的触发指令传输至网络数据处理模块;网络数据处理模块,用于当接收到触发指令,从描述符队列地址寄存器中获取基地址,基于基地址和触发指令读取第一描述符存储区域中的目标描述符,在第一数据存储区域中读取目标描述符对应的目标数据,将目标数据输出至网络。本发明能够把主机内存的访问带宽留给主机上运行的其他功能使用,提高了主机的整体运行效率。
-
公开(公告)号:CN117635476A
公开(公告)日:2024-03-01
申请号:CN202311632057.9
申请日:2023-11-30
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06T5/70 , G06T5/60 , G06N3/082 , G06N3/0495 , G06N3/0455
Abstract: 本发明涉及图像处理技术领域,公开了一种图像生成方法、装置、设备和计算机可读存储介质,依据噪声生成器输出的随机噪声对训练图像进行加噪处理,以得到带噪图像;利用扩散模型包含的编解码器和潜变量空间,对带噪图像和高斯分布采样器采样得到的时间向量进行分析,以得到噪声预测结果。基于噪声预测结果和随机噪声,确定出扩散模型中各模型参数的贡献度;依据各模型参数的贡献度通过剪枝器对扩散模型进行剪枝,以得到压缩后的扩散模型。通过将扩散模型的噪声训练过程压缩到潜变量空间进行学习,提升了扩散模型在服务器上的运行效率。利用压缩后的扩散模型对新获取的噪声图像进行分析,以生成去噪图像,降低了图像生成过程的计算开销。
-
公开(公告)号:CN116992943B
公开(公告)日:2024-02-09
申请号:CN202311255746.2
申请日:2023-09-27
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06N3/082 , G06N3/0464
Abstract: 本发明涉及深度学习技术领域,公开了一种深度神经网络模型的链路剪枝方法、装置、设备和介质,根据待剪枝模型对应的模型图结构,构建第一链路图。在出现具有链接关系的目标相邻顶点时,向第一链路图中填充目标相邻顶点对应的链接关系;直至遍历完第一链路图中的所有相邻顶点,将最终的第一链路图作为第二链路图。基于剪枝需求,从第二链路图中确定出与剪枝需求相关联的所有待剪枝层和剪枝维度,按照各待剪枝层对应的剪枝维度对待剪枝层进行剪枝,从而快速完成待剪枝模型的链路剪枝。通过构建反映各顶点之间链接关系的第二链路图,可以快速自动化实现结构化剪枝策略,极大的提升了模型剪枝的效率。
-
-
-
-
-
-
-
-
-