-
公开(公告)号:CN112329481A
公开(公告)日:2021-02-05
申请号:CN202011167339.2
申请日:2020-10-27
Applicant: 厦门大学
IPC: G06F40/58
Abstract: 本发明提出了一种缓解语言对差异冲突的多语言机器翻译模型的训练方法,该方法包括:获取训练语料,其中,训练语料包括多个语言对;建立多语言机器翻译模型,并根据训练语料的每个语言对对多语言机器翻译模型进行训练;在训练过程中,计算训练语料中所有语言对对应的导数,并对任意两个语言对对应的导数进行冲突调整,以获取调整后的所有语言对对应的导数;根据调整后的所有语言对对应的导数对多语言机器翻译模型参数进行更新,以得到训练好的多语言机器翻译模型;由此,通过对任意两个语言对对应的导数进行冲突调整,从而减轻了不同语言对的训练实例对模型参数更新的导数冲突问题,从而提高了多语言机器翻译模型在多个语言对上的整体效果。
-
公开(公告)号:CN111967277B
公开(公告)日:2022-07-19
申请号:CN202010816635.4
申请日:2020-08-14
Applicant: 厦门大学
Abstract: 本发明提出了一种基于多模态机器翻译模型的翻译方法,包括获取源端句子和对应的翻译图像,并对源端句子和翻译图像进行预处理,以获得处理后的源端句子、翻译图像的全局特征和翻译图像的局部特征;建立多模态机器翻译模型,并根据对多模态机器翻译模型进行训练,其中,多模态机器翻译模型包括编码器和解码器,解码器包括上下文指导的胶囊网络;基于训练好的多模态机器翻译模型对处理后的待翻译的源端句子和对应的翻译图像进行翻译,以生成待翻译的源端句子对应的目标端句子;由此,通过在多模态机器翻译模型的解码器引入上下文指导胶囊网络进行翻译,能够在动态生成丰富的多模态表示的同时,避免引入大量参数,从而有效提升多模态机器翻译的性能。
-
公开(公告)号:CN112329481B
公开(公告)日:2022-07-19
申请号:CN202011167339.2
申请日:2020-10-27
Applicant: 厦门大学
IPC: G06F40/58
Abstract: 本发明提出了一种缓解语言对差异冲突的多语言机器翻译模型的训练方法,该方法包括:获取训练语料,其中,训练语料包括多个语言对;建立多语言机器翻译模型,并根据训练语料的每个语言对对多语言机器翻译模型进行训练;在训练过程中,计算训练语料中所有语言对对应的导数,并对任意两个语言对对应的导数进行冲突调整,以获取调整后的所有语言对对应的导数;根据调整后的所有语言对对应的导数对多语言机器翻译模型参数进行更新,以得到训练好的多语言机器翻译模型;由此,通过对任意两个语言对对应的导数进行冲突调整,从而减轻了不同语言对的训练实例对模型参数更新的导数冲突问题,从而提高了多语言机器翻译模型在多个语言对上的整体效果。
-
公开(公告)号:CN111967277A
公开(公告)日:2020-11-20
申请号:CN202010816635.4
申请日:2020-08-14
Applicant: 厦门大学
Abstract: 本发明提出了一种基于多模态机器翻译模型的翻译方法,包括获取源端句子和对应的翻译图像,并对源端句子和翻译图像进行预处理,以获得处理后的源端句子、翻译图像的全局特征和翻译图像的局部特征;建立多模态机器翻译模型,并根据对多模态机器翻译模型进行训练,其中,多模态机器翻译模型包括编码器和解码器,解码器包括上下文指导的胶囊网络;基于训练好的多模态机器翻译模型对处理后的待翻译的源端句子和对应的翻译图像进行翻译,以生成待翻译的源端句子对应的目标端句子;由此,通过在多模态机器翻译模型的解码器引入上下文指导胶囊网络进行翻译,能够在动态生成丰富的多模态表示的同时,避免引入大量参数,从而有效提升多模态机器翻译的性能。
-
-
-