基于语序增强重建的神经机器翻译方法

    公开(公告)号:CN117973401A

    公开(公告)日:2024-05-03

    申请号:CN202410159513.0

    申请日:2024-02-04

    Abstract: 本发明涉及基于语序增强重建的神经机器翻译方法,属于自然语言处理技术领域。由于不同语种之间存在语序差异,容易出现含有局部语序噪声的输入句子,神经机器翻译模型在面临此类噪声输入时无法产生正确的翻译。为了缓解局部语序噪声带来的影响,本发明提出了基于语序增强重建的神经机器翻译方法,首先通过局部语序噪声生成模块构造噪声数据,其次在编码端引入噪声重建模块和位置预测模块,使模型理解句子的正确位置信息并将噪声表示恢复为干净表示,解码端在翻译损失的基础上引入KL损失,使模型对噪声句子的预测结果趋近于干净句子。通过上述模块,能使模型学习到抵御局部语序噪声的能力,大幅提升模型的鲁棒性。

Patent Agency Ranking