-
公开(公告)号:CN116796760A
公开(公告)日:2023-09-22
申请号:CN202210244066.X
申请日:2022-03-11
Applicant: 华为云计算技术有限公司
IPC: G06F40/58 , G06F40/205 , G06F40/30 , G06F18/214 , G06F40/189
Abstract: 本申请提供一种翻译系统及其训练、应用方法与相关设备,该翻译系统包括第一语言模型和第二语言模型,第一语言模型包括第一编码器、第一对齐编码器、第一对齐解码器和第一解码器,第二语言模型包括第二编码器、第二对齐编码器、第二对齐解码器和第二解码器,通过平行语料对所述第一语言模型和所述第二语言模型进行训练,得到训练好的所述第一语言模型和所述第二语言模型;通过对训练好的第一语言模型和第二语言模型中的编码器和解码器进行组合,即可实现第一语言和第二语言之间的相互翻译。通过使用本申请提供的翻译系统,能够提高翻译系统的训练效率,节约计算资源,并能够提高翻译系统的可扩展性。
-
公开(公告)号:CN116563660A
公开(公告)日:2023-08-08
申请号:CN202210109103.6
申请日:2022-01-28
Applicant: 华为云计算技术有限公司
IPC: G06V10/774 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/044 , G06N3/045 , G06N3/096
Abstract: 本申请公开了一种基于预训练大模型的图像处理方法及相关装置,通过生成网络获取训练图像的特征图像,特征图像的分辨率与训练图像的分辨率相同;将训练图像和特征图像进行融合,得到目标图像;将目标图像输入到预训练大模型中,得到处理结果;根据处理结果,在保持预训练大模型的参数不变的情况下,对生成网络的参数进行更新。本申请中,针对每个下游任务配置了生成网络,在训练过程中,在保持预训练大模型的参数不变的情况下,对生成网络的参数进行更新,从而减少了在下游任务上部署预训练大模型时的训练开销,减少了模型训练难度与迭代更新的难度。
-