一种深度学习模型的流水线并行训练方法及系统

    公开(公告)号:CN116185604A

    公开(公告)日:2023-05-30

    申请号:CN202211594422.7

    申请日:2022-12-13

    Abstract: 本发明提出了一种深度学习模型的流水线并行训练方法及系统,涉及机器学习技术领域,具体方案包括:获取要训练的模型,对模型中每个网络层所占用的内存量进行预估,得到内存预估序列;利用前缀和分区算法对内存预估序列进行分区,将分区均衡分配到流水线上的GPU中;将训练数据集分批连续传入流水线中,进行流水线并行训练;其中,并行训练过程中,采用同步加异步混合的权重缓冲方式,对网络层的权重进行更新;本发明采用一种权重缓冲策略,保证同一小批数据在执行前向传播和反向传播时使用的是同一个版本的参数,从而提高模型训练精度,节省计算资源内存。

    一种基于轻量化的分布式光纤传感事件识别方法及系统

    公开(公告)号:CN116091897A

    公开(公告)日:2023-05-09

    申请号:CN202310238330.3

    申请日:2023-03-14

    Abstract: 本发明属于光纤传感事件图像识别相关技术领域,本发明提出了一种基于轻量化的分布式光纤传感事件识别方法及系统,基于马尔可夫变迁场将分布式传感器事件时序信号数据转换成马尔可夫变迁场二维图像;利用得到的图像对建立的教师网络模型进行预训练;利用预训练好的教师网络模型对所建立的学生网络模型进行中间特征层的一阶知识蒸馏训练;利用预训练好的教师网络模型和经过一阶知识蒸馏的学生网络模型对所述学生网络模型的输出特征层进行二阶知识蒸馏训练,得到训练好的学生网络模型;通过训练好的学生网络模型进行识别,提升了小模型的识别精度,缩短了识别时间,提升了推理速度。

    基于超算的云边协同高通量海洋数据智能处理方法及系统

    公开(公告)号:CN114385601A

    公开(公告)日:2022-04-22

    申请号:CN202210291801.2

    申请日:2022-03-24

    Abstract: 本发明涉及流式数据智能处理技术领域,提供了基于超算的云边协同高通量海洋数据智能处理方法及系统,包括基于历史海洋观测数据构建每个海洋观测数据流的初始海洋数据智能处理模型;实时获取每个海洋观测数据流的数据并进行预处理;基于预处理后的每个海洋观测数据流数据,对相应的初始海洋数据智能处理模型进行实时迭代训练更新,得到每个海洋观测数据流的最新海洋数据智能处理模型,保存在模型版本库中;通过调用每个海洋观测数据流的最新海洋数据智能处理模型对每个海洋观测数据流中不断流入的数据进行实时推理与预测;将超算训练优化后的模型推送到边缘端,在边缘端进行模型更新,并进行具体推理应用,从而避免了数据远程传输,降低了延迟。

Patent Agency Ranking