基于样本重要性的自动机器翻译领域自适应方法

    公开(公告)号:CN105550174A

    公开(公告)日:2016-05-04

    申请号:CN201511023540.2

    申请日:2015-12-30

    CPC classification number: G06F17/289

    Abstract: 基于样本重要性的自动机器翻译领域自适应方法,本发明涉及语言翻译领域,具体涉及一种自动机器翻译领域的自适应方法。为了解决现有的翻译系统的自适应方法不能充分利用训练语料中的领域信息的问题,本发明首先对训练样本添加权重,然后通过统计的方法得到训练样本源语言句子的一元词频分布,使用训练样本源语言句子的一元词频分布计算目标领域文本的句子概率并建立样本权重向量的似然函数,求解最优样本权重向量,确定目标领域文本所属的领域;依据短语对及其翻译概率生成基于样本权重向量的翻译规则,提高翻译系统领域适应性;能够得到具有领域适应能力的翻译系统。本发明适用于语言翻译领域。

Patent Agency Ranking