一种深度学习模型的流水线并行训练方法及系统

    公开(公告)号:CN116185604A

    公开(公告)日:2023-05-30

    申请号:CN202211594422.7

    申请日:2022-12-13

    Abstract: 本发明提出了一种深度学习模型的流水线并行训练方法及系统,涉及机器学习技术领域,具体方案包括:获取要训练的模型,对模型中每个网络层所占用的内存量进行预估,得到内存预估序列;利用前缀和分区算法对内存预估序列进行分区,将分区均衡分配到流水线上的GPU中;将训练数据集分批连续传入流水线中,进行流水线并行训练;其中,并行训练过程中,采用同步加异步混合的权重缓冲方式,对网络层的权重进行更新;本发明采用一种权重缓冲策略,保证同一小批数据在执行前向传播和反向传播时使用的是同一个版本的参数,从而提高模型训练精度,节省计算资源内存。

    一种水下图像增强方法、系统和设备

    公开(公告)号:CN114004766A

    公开(公告)日:2022-02-01

    申请号:CN202111311399.1

    申请日:2021-11-08

    Abstract: 本发明公开了水下图像增强方法、系统和设备,水下图像增强方法,包括以下步骤:获取水下视频或图像数据;通过数据增强生成对抗网络,对所述视频或图像数据使用预设算法进行预处理得到衰减图及雾化效果图,对所述衰减图及雾化效果图提取特征获取水下仿真数据,将所述水下视频或图像数据与对应的水下仿真数据生成配对数据集;利用修复生成对抗网络对得到的配对数据集进行判别器计算损失数并进行训练得到水下图像修复模型。能够根据实际水下退化质量生成对应的仿真配对数据集,不需要参数调节,基于多尺度特征融合的水下增强算法修复水下图像颜色。

    基于高效微调和联邦学习的行业大模型训练方法及系统

    公开(公告)号:CN118982074A

    公开(公告)日:2024-11-19

    申请号:CN202411463393.X

    申请日:2024-10-21

    Abstract: 本发明提出一种基于高效微调和联邦学习的行业大模型训练方法及系统,涉及联邦学习领域。该方法由中心端执行,包括:获取原始全局模型,初始化可调低秩矩阵;所述可调低秩矩阵用于根据客户端资源量进行秩缩放;将模型结构和可调低秩矩阵发送给各客户端,以使各客户端基于本地数据对可调低秩矩阵进行微调训练,得到更新的可调低秩矩阵,并发送至中心端;将更新的可调低秩矩阵进行聚合,更新原始全局模型的权重文件,得到优化的全局模型。本发明客户端在微调训练时对预训练权重进行量化,并对具有秩缩放功能的可调低秩矩阵进行微调训练,以提取客户端本地数据有效特征,实现了模型参数的灵活调整与资源的高效利用。

Patent Agency Ranking