数据中心网络流量生成方法、装置、介质及计算机程序

    公开(公告)号:CN118070850B

    公开(公告)日:2024-06-18

    申请号:CN202410466658.5

    申请日:2024-04-18

    申请人: 清华大学

    发明人: 李丹 汪锡峥

    摘要: 本发明涉及数据处理技术领域,特别涉及一种数据中心网络流量生成方法、装置、介质及计算机程序,其中,方法包括:获取训练数据集,利用训练数据集训练生成器模型,其中,生成器模型用于生成每种生成规则与对应网络流量的相似度矩阵;将目标生成规则输入训练完成的生成器模型,生成器模型输出目标生成规则的相似度矩阵,利用目标生成规则的相似度矩阵生成目标生成规则对应的网络流量。由此,解决了相关技术中通过在网络设备上配置生成规则并收集符合该规则的流量,仅适用于能够下发规则并能够操纵交换机等网络设备的用户,且每次获取流量时需要重新部署规则并采集,存在操作复杂及适用性低等问题。

    数据中心智能训练仿真事务加速方法、装置、设备及介质

    公开(公告)号:CN118069374A

    公开(公告)日:2024-05-24

    申请号:CN202410466627.X

    申请日:2024-04-18

    申请人: 清华大学

    摘要: 本发明涉及电数字数据处理技术领域,特别涉及一种数据中心智能训练仿真事务加速方法、装置、设备及介质,其中,方法包括:获取当前CPU算力和当前待仿真的GPU算力;根据当前CPU算力和当前待仿真的GPU算力确定当前分布式仿真策略,并在基于当前分布式仿真策略进行仿真时,判断当前分布式仿真策略中的事务队列是否存在确定性仿真事务,若存在确定性仿真事务,则删除确定性仿真事务,并基于剩余仿真事务进行加速仿真。由此,解决了相关技术的仿真系统效率低,耗时长等问题,通过大模型集群的结构和模型训练的特征,运用多CPU核的分布式仿真以降低整个仿真系统的事务数量,从而提高仿真效率。

    支持场景快速适应的数据中心网络流量模型训练方法

    公开(公告)号:CN118301006A

    公开(公告)日:2024-07-05

    申请号:CN202410467067.X

    申请日:2024-04-18

    申请人: 清华大学

    发明人: 李丹 汪锡峥

    摘要: 本发明涉及数字信息的传输技术领域,特别涉及一种支持场景快速适应的数据中心网络流量模型训练方法,其中,方法包括:获取当前网络流量场景中的网络流量数据;基于待更新网络流量大模型的目标训练层的输入格式标准和输出格式标准,将网络流量数据转换为输入数据和输出数据,其中,待更新网络流量大模型由多层神经网络模型Transformer构成;基于预设的LoRA模型,利用输入数据和输出数据训练目标训练层的低秩参数矩阵,并利用训练后的低秩参数矩阵更新待更新网络流量大模型,以通过更新后的网络流量大模型对新网络流量场景快速适应。由此,避免对模型的整体重训练,在保证生成流量保真度的基础上降低模型的重训练时间,实现对新场景的快速适应。

    通用的RDMA流级优先级调度方法、装置、设备及介质

    公开(公告)号:CN116436869A

    公开(公告)日:2023-07-14

    申请号:CN202310457839.7

    申请日:2023-04-25

    申请人: 清华大学

    发明人: 李丹 汪锡峥 王帅

    IPC分类号: H04L47/6275 H04L47/43

    摘要: 本申请涉及数据中心网络技术领域,特别涉及一种通用的RDMA流级优先级调度方法、装置、设备及介质,其中,方法包括:通过接口获取上层应用的传输数据和传输数据的优先级;根据优先级确定传输数据在RDMA连接内部的发送队列中的目标位置,将传输数据插入发送队列中的目标位置,得到发送队列的最优传输顺序;按照最优传输顺序传输发送队列中的数据。由此,解决了相关技术中RDMA的消息传输顺序仅能严格地遵守应用递交的顺序,可能会造成队头阻塞等情况,影响应用的性能等问题。

    数据中心智能训练仿真事务加速方法、装置、设备及介质

    公开(公告)号:CN118069374B

    公开(公告)日:2024-06-18

    申请号:CN202410466627.X

    申请日:2024-04-18

    申请人: 清华大学

    摘要: 本发明涉及电数字数据处理技术领域,特别涉及一种数据中心智能训练仿真事务加速方法、装置、设备及介质,其中,方法包括:获取当前CPU算力和当前待仿真的GPU算力;根据当前CPU算力和当前待仿真的GPU算力确定当前分布式仿真策略,并在基于当前分布式仿真策略进行仿真时,判断当前分布式仿真策略中的事务队列是否存在确定性仿真事务,若存在确定性仿真事务,则删除确定性仿真事务,并基于剩余仿真事务进行加速仿真。由此,解决了相关技术的仿真系统效率低,耗时长等问题,通过大模型集群的结构和模型训练的特征,运用多CPU核的分布式仿真以降低整个仿真系统的事务数量,从而提高仿真效率。

    数据中心网络流量生成方法、装置、介质及计算机程序

    公开(公告)号:CN118070850A

    公开(公告)日:2024-05-24

    申请号:CN202410466658.5

    申请日:2024-04-18

    申请人: 清华大学

    发明人: 李丹 汪锡峥

    摘要: 本发明涉及数据处理技术领域,特别涉及一种数据中心网络流量生成方法、装置、介质及计算机程序,其中,方法包括:获取训练数据集,利用训练数据集训练生成器模型,其中,生成器模型用于生成每种生成规则与对应网络流量的相似度矩阵;将目标生成规则输入训练完成的生成器模型,生成器模型输出目标生成规则的相似度矩阵,利用目标生成规则的相似度矩阵生成目标生成规则对应的网络流量。由此,解决了相关技术中通过在网络设备上配置生成规则并收集符合该规则的流量,仅适用于能够下发规则并能够操纵交换机等网络设备的用户,且每次获取流量时需要重新部署规则并采集,存在操作复杂及适用性低等问题。

    智算中心网络架构的仿真寻优方法、装置、设备及介质

    公开(公告)号:CN118101493B

    公开(公告)日:2024-06-25

    申请号:CN202410466606.8

    申请日:2024-04-18

    申请人: 清华大学

    IPC分类号: H04L41/14 H04L41/16

    摘要: 本发明涉及电数字数据处理技术领域,特别涉及一种智算中心网络架构的仿真寻优方法、装置、设备及介质。方法包括:获取待训练大语言模型的训练配置信息;基于训练配置信息和预设的离散事件仿真策略,利用预设仿真器对待训练大语言模型进行训练仿真,得到仿真结果,其中,预设仿真器利用预设ECS框架得到;根据仿真结果调整智算中心网络架构,并得到最优的智算中心网络架构。由此,通过采用实体组件系统框架设计智算中心网络仿真器,能够实现大语言模型训练的完整仿真过程,以寻找最优的智算中心网络架构,解决了现有网络仿真器不具备可扩展性,无法支持大规模智算中心网络的仿真的问题,从而提升仿真大规模智算中心网络的效率和准确性。

    数据中心网络流量超分辨率的生成方法、装置及程序

    公开(公告)号:CN118095358B

    公开(公告)日:2024-06-25

    申请号:CN202410466615.7

    申请日:2024-04-18

    申请人: 清华大学

    摘要: 本发明涉及数据处理技术领域,特别涉及一种数据中心网络流量超分辨率的生成方法、装置及程序,其中,方法包括:获取网络设备的第一流量统计信息;将第一流量统计信息输入至树状流量超分辨率模型,树状流量超分辨率模型输出第二流量统计信息,其中,第二流量统计信息的统计周期小于第一流量统计信息的统计周期,树状流量超分辨率模型包括多层粒状流量转换器模型,多层粒状流量转换器模型呈树状结构,将第一流量统计信息逐层还原成第二流量统计信息;根据第二流量统计信息生成网络设备的网络流量数据。由此,解决了相关技术中流量生成方法导致网络流量数据的时效性较差、精确度较低以及适用性较低等问题。

    智算中心网络架构的仿真寻优方法、装置、设备及介质

    公开(公告)号:CN118101493A

    公开(公告)日:2024-05-28

    申请号:CN202410466606.8

    申请日:2024-04-18

    申请人: 清华大学

    IPC分类号: H04L41/14 H04L41/16

    摘要: 本发明涉及电数字数据处理技术领域,特别涉及一种智算中心网络架构的仿真寻优方法、装置、设备及介质。方法包括:获取待训练大语言模型的训练配置信息;基于训练配置信息和预设的离散事件仿真策略,利用预设仿真器对待训练大语言模型进行训练仿真,得到仿真结果,其中,预设仿真器利用预设ECS框架得到;根据仿真结果调整智算中心网络架构,并得到最优的智算中心网络架构。由此,通过采用实体组件系统框架设计智算中心网络仿真器,能够实现大语言模型训练的完整仿真过程,以寻找最优的智算中心网络架构,解决了现有网络仿真器不具备可扩展性,无法支持大规模智算中心网络的仿真的问题,从而提升仿真大规模智算中心网络的效率和准确性。

    数据中心网络流量超分辨率的生成方法、装置及程序

    公开(公告)号:CN118095358A

    公开(公告)日:2024-05-28

    申请号:CN202410466615.7

    申请日:2024-04-18

    申请人: 清华大学

    摘要: 本发明涉及数据处理技术领域,特别涉及一种数据中心网络流量超分辨率的生成方法、装置及程序,其中,方法包括:获取网络设备的第一流量统计信息;将第一流量统计信息输入至树状流量超分辨率模型,树状流量超分辨率模型输出第二流量统计信息,其中,第二流量统计信息的统计周期小于第一流量统计信息的统计周期,树状流量超分辨率模型包括多层粒状流量转换器模型,多层粒状流量转换器模型呈树状结构,将第一流量统计信息逐层还原成第二流量统计信息;根据第二流量统计信息生成网络设备的网络流量数据。由此,解决了相关技术中流量生成方法导致网络流量数据的时效性较差、精确度较低以及适用性较低等问题。