一种分布式训练的集合通信控制方法、装置及介质

    公开(公告)号:CN119336451A

    公开(公告)日:2025-01-21

    申请号:CN202411863321.4

    申请日:2024-12-17

    Abstract: 本申请公开了一种分布式训练的集合通信控制方法、装置及介质,该方法包括:当参与数据归约的集群中,任意两个集群之间的计算节点数量的差距在预设范围内时,将第一集群内所有计算节点上的数据归约至指定计算节点上,指定计算节点的数量与计算节点数量最小的第二集群内计算节点的数量相同。控制指定计算节点与第二集群内的计算节点进行数据归约;控制指定计算节点与第一集群内除指定计算节点外的其他节点数据同步。由此,除计算节点数量最少的集群外的其他集群,先在集群内部进行一次归约,将数据归约至数量与各集群中最少节点的数量相同的指定计算节点上,保证跨集群归约时各集群节点相同,避免一些节点同时和多个节点归约,降低集合通信开销。

    一种链路泛洪攻击下诱饵主机的识别方法与装置

    公开(公告)号:CN119276638A

    公开(公告)日:2025-01-07

    申请号:CN202411795141.7

    申请日:2024-12-09

    Abstract: 本发明公开了一种链路泛洪攻击下诱饵主机的识别方法与装置,该该方法包括:在SDN控制器中获取全局路由信息后,选择关键交换机并按其分布将网络划分成多个监测区域;对每个监测区域离线训练用于流量分类的改进的RF模型,再在SDN控制器中将所有训练好的RF模型转换成符合P4交换机规范的转发规则,并安装到关键交换机上;在交换机内运行转发规则以线速进行流量分类,并将分类结果汇报给SDN控制器;根据分类结果识别出诱饵主机的地址。本发明显著减少了控制器与数据平面间和数据平面内的通信开销,提高了LFA下诱饵主机的识别正确率和时间效率,为LFA的安全防御提供了高效、资源节约的解决方案,提高了SDN应对LFA的效率。

    一种模型数据的管理方法、装置、存储介质及电子设备

    公开(公告)号:CN118377436A

    公开(公告)日:2024-07-23

    申请号:CN202410821445.X

    申请日:2024-06-24

    Abstract: 本说明书公开了一种模型数据的管理方法、装置、存储介质及电子设备。所述模型数据的管理方法包括:获取待存储的模型数据,并按照预设的数据页存储空间,将模型数据划分为若干个第一数据页;基于当前时刻生成的密钥,对每个第一数据页进行加密,得到各加密数据页,并根据各加密数据页生成的散列值对密钥进行加密,得到密钥数据页;构建包含各加密数据页和密钥数据页的数据条,并进行冗余编码,得到至少两个冗余数据页;将数据条中的各数据页和各冗余数据页写入存储设备,并对存储设备中存储的数据进行读取、恢复、更新、删除等数据管理。本方案有效避免了数据泄露以及损坏的风险,提高了数据的安全性。

    一种基于硬件特征的算子调度方案自动搜索方法与系统

    公开(公告)号:CN117950645A

    公开(公告)日:2024-04-30

    申请号:CN202410339678.6

    申请日:2024-03-25

    Abstract: 本发明提供一种基于硬件特征的算子调度方案自动搜索方法与系统。该方法是通过获取算子输入数据的维度信息、目标硬件的硬件特征以及包含各存储层级的容量和硬件指令支持情况;再根据目标硬件的存储层级从高到低,递归地在每一个层级上,基于贪心策略搜索该层级可接受的最佳可行的数据搬运方案;其中各层级的数据搬运方案共同构成算子的调度方案;最后进行性能评估。基于搜索到的若干个算子调度方案,通过CodeGen技术生成目标硬件上的若干个算子实现,进而在硬件上测试选出性能最优的算子调度方案。因此,本发明的技术方案能够节省算力的情况下保证算子调度的优化。

    一种基于分段量化的检查点写入方法及装置

    公开(公告)号:CN117873789A

    公开(公告)日:2024-04-12

    申请号:CN202410287649.X

    申请日:2024-03-13

    Abstract: 在本说明书提供的一种基于分段量化的检查点写入方法及装置中,获取待写入的模型状态,并针对该模型状态中每个向量值,确定该向量值中数值的取值范围以及初始量化位宽,通过分段数量对该向量值进行分段,并针对该向量值中每个数值,确定该数值的所属分段以及该所属分段的分段取值范围,进而对该数值进行量化,根据量化后的各数值,确定量化后的该向量值,并写入检查点文件,该检查点文件用于模型的模型状态恢复。通过分段数量对该向量值进行分段,以及通过精准划分各所属分段的分段取值范围,再对各数值进行量化,在减少存储需求的同时,降低了数值量化的精度损失,并将各量化后的向量值全量写入检查点文件,减少恢复模型状态的复杂性。

    一种固态盘存储系统的选择性数据压缩方法及装置

    公开(公告)号:CN117666968A

    公开(公告)日:2024-03-08

    申请号:CN202311759362.4

    申请日:2023-12-20

    Abstract: 本发明公开了一种固态盘存储系统的选择性数据压缩方法及装置,该方法是在固态盘存储系统上设置压缩位图表和三个功能模块:负载监测模块、数据压缩模块和数据解压缩模块,由请求类型判断步骤、数据的压缩写入步骤和数据的解压缩读取步骤组成。根据系统的当前负载和CPU计算资源状态,该方法充分利用存储系统中数据的冗余特性和固态盘的闪存介质特性,通过利用动态的数据压缩技术减少冗余信息,减少写入数据量,以此缓解固态盘读写性能不对称的问题,同时提升固态盘的空间利用率和可靠性。

    一种节点故障感知的分布式模型训练的方法及装置

    公开(公告)号:CN116755941B

    公开(公告)日:2024-01-09

    申请号:CN202311053457.4

    申请日:2023-08-21

    Inventor: 陈光 李勇 朱世强

    Abstract: 本说明书公开了一种节点故障感知的分布式模型训练的方法及装置,通过为每个模型训练时所使用到的设备节点分配备份节点,以使得当监测到设备节点出现故障时,发生故障的设备节点所对应的备份节点能够接替该故障节点继续执行模型训练的任务,从而能够保证模型训练任务的执行效率。

    一种算子优化方法、装置、存储介质及电子设备

    公开(公告)号:CN116663618B

    公开(公告)日:2023-12-05

    申请号:CN202310941263.1

    申请日:2023-07-28

    Abstract: 本说明书公开了一种算子优化方法、装置、存储介质及电子设备。在本说明书提供的算子优化方法中,获取目标神经网络模型,并确定目标神经网络模型的计算图;针对计算图中每个算子,确定包含该算子所有可行解的搜索空间;在搜索空间中选择若干可行解作为候选解,确定各候选解的评估值,并将评估值最高的作为待定解;确定目标硬件运行待定解的运行时间,并增加迭代次数;当运行时间小于当前最优时间或不存在当前最优时间时,将运行时间确定为当前最优时间,并将待定解确定为当前最优解;当迭代次数小于指定次数时,重新在该算子的搜索空间中选择指定数量个未被选择过的候选解;当迭代次数不小于指定次数时,将当前最优解确定为该

Patent Agency Ranking