一种深度神经网络模型的训练方法及装置

    公开(公告)号:CN114913405A

    公开(公告)日:2022-08-16

    申请号:CN202210661970.0

    申请日:2022-06-13

    摘要: 本申请公开了一种深度神经网络模型的训练方法及装置。本申请实施例提供的方法首先采用样本量充足的第一类别的图像样本对初始检测模型和初始难度预测模型进行联合训练,并将训练后的初始检测模型确定为候选检测模型,将训练后的初始难度预测模型确定为候选难度预测模型。经过联合训练的候选检测模型和候选难度预测模型具备了一定的学习能力,为后续模型学习样本量稀缺的图像样本提供了基础。然后使用样本量充足的第一类别的图像样本和样本量稀缺的第二类别的图像样本对候选检测模型和候选难度预测模型进行联合训练,以使候选检测模型和候选难度模型能够快速学习样本量稀缺的图像样本的特征,以此在保证模型训练效率的同时,还提高了模型的精度。

    基于叠加扩散模型的推理网络仿真流量生成方法和装置

    公开(公告)号:CN118827410A

    公开(公告)日:2024-10-22

    申请号:CN202410839469.8

    申请日:2024-06-26

    IPC分类号: H04L41/14 H04L41/16

    摘要: 本发明涉及一种基于叠加扩散模型的推理网络仿真流量生成方法和装置,包括将网络流量样本转换为视频样本数据;利用视频样本数据和样本指示文本对待训练的叠加扩散模型进行训练和推理,得到已训练的叠加扩散模型;利用目标大模型和待生成网络流量的指示文本对已训练的叠加扩散模型进行微调,通过待生成网络流量的指示文本和已微调后的叠加扩散模型,得到待转换视频数据,并将待转换视频数据转换成网络流量序列进行输出。本发明解决传统流量生成方法无法为智算数据中心的设计和建设提供更为准确和可靠的流量数据支持的技术问题。本发明还涉及一种设备和存储介质。