-
公开(公告)号:CN115879480A
公开(公告)日:2023-03-31
申请号:CN202211406961.3
申请日:2022-11-10
Applicant: 中国科学院自动化研究所
IPC: G06F40/58 , G06F40/279 , G06F40/30
Abstract: 本发明提供一种语义约束机器翻译方法、装置、电子设备及存储介质,其中语义约束机器翻译方法,包括:获取源端语言篇章文本在目标端语言中的目标约束词序列;将源端语言篇章文本和目标约束词序列输入至预设机器翻译模型中进行翻译,输出源端语言篇章文本的机器翻译结果;其中,预设机器翻译模型包括对源端语言篇章文本和目标约束词序列对应的目标词向量矩阵先进行多层编解码、后进行上下文‑约束词解码,并基于顶层解码器输出的结果和上下文‑约束词解码的结果确定机器翻译结果。使用本发明通过充分利用约束词和上下文之间的语义信息的交互关系的方式,能够大幅提高机器翻译模型性能和机器翻译模型的整体翻译质量。
-
公开(公告)号:CN117034968B
公开(公告)日:2024-02-02
申请号:CN202311304326.9
申请日:2023-10-10
Applicant: 中国科学院自动化研究所
IPC: G06F40/58 , G06N3/0455 , G06N3/08
Abstract: 本发明提供一种神经机器翻译方法、装置、电子设备及介质,属于机器翻译技术领域。该方法应用于机器翻译模型,机器翻译模型包括编码器和解码器,该方法包括:识别待翻译的源语言句子对应的目标翻译规则模板,所述目标翻译规则模板包括第一源端模板、第一目标端模板和第一源端变量片段;基于第一约束提示序列和待翻译的源语言句子,得到编码器的输入;基于第一约束提示序列和解码器的初始输入序列,得到解码器的输入;所述第一约束提示序列为依次拼接所述第一源端模板、所述第一源端变量片段和所述第一目标端模板后得到的;基于编码器的输入和解码器的输入,得到机器翻译模型输出的翻译结果。本发明提供的神经机器翻译方法,可以提高翻译准确性。
-
公开(公告)号:CN117034968A
公开(公告)日:2023-11-10
申请号:CN202311304326.9
申请日:2023-10-10
Applicant: 中国科学院自动化研究所
IPC: G06F40/58 , G06N3/0455 , G06N3/08
Abstract: 本发明提供一种神经机器翻译方法、装置、电子设备及介质,属于机器翻译技术领域。该方法应用于机器翻译模型,机器翻译模型包括编码器和解码器,该方法包括:识别待翻译的源语言句子对应的目标翻译规则模板,所述目标翻译规则模板包括第一源端模板、第一目标端模板和第一源端变量片段;基于第一约束提示序列和待翻译的源语言句子,得到编码器的输入;基于第一约束提示序列和解码器的初始输入序列,得到解码器的输入;所述第一约束提示序列为依次拼接所述第一源端模板、所述第一源端变量片段和所述第一目标端模板后得到的;基于编码器的输入和解码器的输入,得到机器翻译模型输出的翻译结果。本发明提供的神经机器翻译方法,可以提高翻译准确性。
-
公开(公告)号:CN117540753A
公开(公告)日:2024-02-09
申请号:CN202311260795.5
申请日:2023-09-27
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种同声传译模型训练方法、装置、电子设备及存储介质,应用于自然语言处理技术领域。该方法包括:获取第一样本,所述第一样本包括第一待译文本;将所述第一待译文本中的固定短语替换为目标语言序列,得到第二样本;将所述第二样本输入同声传译模型进行模型训练;其中,所述目标语言序列包括与所述固定短语对应的译文。
-
公开(公告)号:CN117521678A
公开(公告)日:2024-02-06
申请号:CN202311225136.8
申请日:2023-09-21
Applicant: 中国科学院自动化研究所
IPC: G06F40/58 , G06F40/42 , G06N3/0455 , G06N3/096
Abstract: 本发明提供一种同声传译模型训练方法、装置、电子设备及存储介质,应用于自然语言处理技术领域。该方法包括:获取训练样本,所述训练样本包括待翻译文本;将所述待翻译文本输入离线翻译模型和同步翻译模型,得到中间变量层损失函数和输出变量层损失函数;根据所述中间变量层损失函数和输出变量层损失函数确定同声传译模型的目标损失函数;其中,所述同声传译模型包括所述离线翻译模型和所述同步翻译模型。
-
-
-
-