-
公开(公告)号:CN118694765B
公开(公告)日:2024-12-27
申请号:CN202411187773.5
申请日:2024-08-28
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: H04L67/1001 , G06F18/214
Abstract: 本发明公开了一种数据传输方法、装置、设备及计算机可读存储介质,涉及计算机应用技术领域,包括:利用发送端智能网卡接收浮点型模型训练数据集,并进行量化操作,分别对得到的各量化后模型训练数据进行损失度计算;利用发送端智能网卡将损失度计算结果满足预设损失度允许范围的量化后模型训练数据发送给接收端智能网卡,并将损失度计算结果超出预设损失度允许范围的量化后模型训练数据对应的浮点型模型训练数据发送给接收端智能网卡;利用接收端智能网卡对量化后模型训练数据进行反量化,将各浮点型模型训练数据均上传至接收端。本发明解决了数据量化速度慢,数据传输耗时长等问题,较大地提高了数据量化速度,降低了传输耗时。
-
公开(公告)号:CN118694765A
公开(公告)日:2024-09-24
申请号:CN202411187773.5
申请日:2024-08-28
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: H04L67/1001 , G06F18/214
Abstract: 本发明公开了一种数据传输方法、装置、设备及计算机可读存储介质,涉及计算机应用技术领域,包括:利用发送端智能网卡接收浮点型模型训练数据集,并进行量化操作,分别对得到的各量化后模型训练数据进行损失度计算;利用发送端智能网卡将损失度计算结果满足预设损失度允许范围的量化后模型训练数据发送给接收端智能网卡,并将损失度计算结果超出预设损失度允许范围的量化后模型训练数据对应的浮点型模型训练数据发送给接收端智能网卡;利用接收端智能网卡对量化后模型训练数据进行反量化,将各浮点型模型训练数据均上传至接收端。本发明解决了数据量化速度慢,数据传输耗时长等问题,较大地提高了数据量化速度,降低了传输耗时。
-
公开(公告)号:CN117764132A
公开(公告)日:2024-03-26
申请号:CN202311786868.4
申请日:2023-12-22
Applicant: 浪潮(北京)电子信息产业有限公司
Abstract: 本申请公开了一种数据传输方法、装置、系统及电子设备和存储介质,涉及计算机技术领域,该方法包括:第一节点判断神经网络模型的训练是否处于震荡收敛阶段;若是,则对需要传输的原始数据进行量化操作得到量化数据;其中,原始数据为浮点数据,量化数据为整型数据;将量化数据发送至第二节点,以便第二节点对接收到的量化数据进行反量化操作得到原始数据,并利用原始数据对神经网络模型进行训练。本申请既保证了神经网络模型的训练精度,同时又可以有效降低网络通讯量,节省网络带宽占用,提高通信效率,从而加快神经网络模型的训练速度。
-
公开(公告)号:CN116708301A
公开(公告)日:2023-09-05
申请号:CN202310868402.2
申请日:2023-07-14
Applicant: 浪潮(北京)电子信息产业有限公司
Abstract: 本申请公开了一种数据传输方法、装置、设备及存储介质,涉及计算机技术领域。应用于智能网卡的数据发送端,该方法包括:确定当前网络状态;获取原始数据精度的待传输数据,并根据当前网络状态确定与原始数据精度的待传输数据对应的数据传输策略;基于数据传输策略确定进行数据传输时对应的目标数据精度,并基于原始数据精度的待传输数据确定目标数据精度的待传输数据;将目标数据精度的待传输数据发送至数据接收端,以便数据接收端根据目标数据精度,确定与目标数据精度的待传输数据对应的数据处理逻辑。通过本申请的技术方案,可以根据网络状态决定数据传输精度,将网络状态检测与判断、数据精度检测与转换等操作在智能网卡中实现。
-
公开(公告)号:CN116701692B
公开(公告)日:2023-11-03
申请号:CN202310974784.7
申请日:2023-08-04
Applicant: 浪潮(北京)电子信息产业有限公司
Abstract: 本发明公开了一种图像生成方法、装置、设备及介质,应用于图像生成技术领域,包括:将第一输入数据输入至目标扩散模型进行推理,并在推理过程中获取每次迭代的输出结果;第一输入数据包括第一噪声和第一文本信息;基于相邻两次迭代的输出结果计算散度,得到散度序列;对所述散度序列进行分组以得到散度组,并依次对每个散度组对应的推理阶段中的目标扩散模型进行参数量化;推理阶段为散度组中各散度对应的迭代次数所对应的推理阶段;基于第二输入数据以及参数量化后的目标扩散模型生成图像;所述第二输入数据包括第二噪声和第二文本信息。能够解决模型推理速度慢的问题,提升模型推理速度,进而提升图像的生成效率。
-
公开(公告)号:CN116992943B
公开(公告)日:2024-02-09
申请号:CN202311255746.2
申请日:2023-09-27
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06N3/082 , G06N3/0464
Abstract: 本发明涉及深度学习技术领域,公开了一种深度神经网络模型的链路剪枝方法、装置、设备和介质,根据待剪枝模型对应的模型图结构,构建第一链路图。在出现具有链接关系的目标相邻顶点时,向第一链路图中填充目标相邻顶点对应的链接关系;直至遍历完第一链路图中的所有相邻顶点,将最终的第一链路图作为第二链路图。基于剪枝需求,从第二链路图中确定出与剪枝需求相关联的所有待剪枝层和剪枝维度,按照各待剪枝层对应的剪枝维度对待剪枝层进行剪枝,从而快速完成待剪枝模型的链路剪枝。通过构建反映各顶点之间链接关系的第二链路图,可以快速自动化实现结构化剪枝策略,极大的提升了模型剪枝的效率。
-
公开(公告)号:CN116992943A
公开(公告)日:2023-11-03
申请号:CN202311255746.2
申请日:2023-09-27
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06N3/082 , G06N3/0464
Abstract: 本发明涉及深度学习技术领域,公开了一种深度神经网络模型的链路剪枝方法、装置、设备和介质,根据待剪枝模型对应的模型图结构,构建第一链路图。在出现具有链接关系的目标相邻顶点时,向第一链路图中填充目标相邻顶点对应的链接关系;直至遍历完第一链路图中的所有相邻顶点,将最终的第一链路图作为第二链路图。基于剪枝需求,从第二链路图中确定出与剪枝需求相关联的所有待剪枝层和剪枝维度,按照各待剪枝层对应的剪枝维度对待剪枝层进行剪枝,从而快速完成待剪枝模型的链路剪枝。通过构建反映各顶点之间链接关系的第二链路图,可以快速自动化实现结构化剪枝策略,极大的提升了模型剪枝的效率。
-
公开(公告)号:CN116701692A
公开(公告)日:2023-09-05
申请号:CN202310974784.7
申请日:2023-08-04
Applicant: 浪潮(北京)电子信息产业有限公司
Abstract: 本发明公开了一种图像生成方法、装置、设备及介质,应用于图像生成技术领域,包括:将第一输入数据输入至目标扩散模型进行推理,并在推理过程中获取每次迭代的输出结果;第一输入数据包括第一噪声和第一文本信息;基于相邻两次迭代的输出结果计算散度,得到散度序列;对所述散度序列进行分组以得到散度组,并依次对每个散度组对应的推理阶段中的目标扩散模型进行参数量化;推理阶段为散度组中各散度对应的迭代次数所对应的推理阶段;基于第二输入数据以及参数量化后的目标扩散模型生成图像;所述第二输入数据包括第二噪声和第二文本信息。能够解决模型推理速度慢的问题,提升模型推理速度,进而提升图像的生成效率。
-
-
-
-
-
-
-